跳转到主要内容
Craft 的 AI 助手可以帮助你直接在文档中理解、总结和描述图片和 PDF。当你将鼠标悬停在支持的内容上时,会出现快捷操作按钮,让你可以即时进行交互。
图片和 PDF OCR 支持已在 3.3.5 版本中添加,轻松实现文本提取、标题生成和无障碍替代文本创建。

PDF 支持

AI 助手可以使用 Max 模型读取和解析附加到文档中的 PDF 文件。 PDF 可以做的事情:
  • 生成整个文档的摘要
  • 就内容提出问题
  • 提取关键要点或见解
  • 获取特定信息
这在以下场景中特别有用:
  • 研究论文和文章
  • 报告和白皮书
  • 文档和手册
  • 会议记录和演示文稿

图片支持

AI 助手与图片配合尤为出色,能为视觉内容提供快速结果。

支持的图片格式

  • PNG
  • JPG
  • JPEG
  • GIF
  • WEBP
目前不支持 HEIC 图片。在使用助手之前,请将 HEIC 文件转换为 JPG 或 PNG。

图片可以做的事情

  • 生成标题 – 为图片创建描述性标题
  • 获取摘要 – 了解图片展示的内容
  • 创建详细描述 – 生成深入的解读
  • 提升无障碍性 – 为屏幕阅读器生成替代文本
  • 提取文本 – 从截图或文档照片中获取文本
使用场景:
  • 文档和指南
  • 会议白板和图表
  • UI 或设计截图
  • 图表和图形
  • 无障碍合规(替代文本生成)

使用 OCR 功能

1
将图片或 PDF 添加到文档中。
2
将鼠标悬停在图片或 PDF 块上。
3
点击出现的助手快捷操作按钮。
4
选择你想要执行的操作:生成标题、总结、提取文本或提出自定义问题。
助手将处理内容并即时提供结果。

代码块

除了图片和 PDF,AI 助手还可以帮助处理代码块
  • 解释代码的功能
  • 帮助调试问题
  • 阐明逻辑或结构
  • 建议改进方案
这使 Craft 成为技术文档和开发笔记的强大工具。

获得最佳结果的技巧

对于图片:
  • 尽可能使用清晰的高分辨率图片
  • 确保图片中的文本清晰可读
  • 裁剪不必要的内容以获得更精准的结果
对于 PDF:
  • 确保使用的是 Max 模型(其他模型不支持文件附件)
  • 较小的 PDF 处理速度更快
  • 格式良好、文本清晰的 PDF 效果最佳
  • 考虑将非常大的 PDF 分成多个部分
对于代码:
  • 提供代码用途的相关上下文
  • 如果编程语言不明显,请注明
  • 提出具体问题以获得更好的回答

相关文章

使用 Craft Assistant

学习使用助手的基础知识

自定义提示词

创建可重复使用的提示词,确保图片描述的一致性

选择 AI 模型

选择合适的模型来处理图片和 PDF

文档中的媒体

了解如何添加和管理图片及文件

代码块

获取 AI 辅助进行代码分析和调试