图片和 PDF OCR 支持已在 3.3.5 版本中添加,轻松实现文本提取、标题生成和无障碍替代文本创建。
PDF 支持
AI 助手可以使用 Max 模型读取和解析附加到文档中的 PDF 文件。 PDF 可以做的事情:- 生成整个文档的摘要
- 就内容提出问题
- 提取关键要点或见解
- 获取特定信息
- 研究论文和文章
- 报告和白皮书
- 文档和手册
- 会议记录和演示文稿
图片支持
AI 助手与图片配合尤为出色,能为视觉内容提供快速结果。支持的图片格式
- PNG
- JPG
- JPEG
- GIF
- WEBP
图片可以做的事情
- 生成标题 – 为图片创建描述性标题
- 获取摘要 – 了解图片展示的内容
- 创建详细描述 – 生成深入的解读
- 提升无障碍性 – 为屏幕阅读器生成替代文本
- 提取文本 – 从截图或文档照片中获取文本
- 文档和指南
- 会议白板和图表
- UI 或设计截图
- 图表和图形
- 无障碍合规(替代文本生成)
使用 OCR 功能
助手将处理内容并即时提供结果。代码块
除了图片和 PDF,AI 助手还可以帮助处理代码块:- 解释代码的功能
- 帮助调试问题
- 阐明逻辑或结构
- 建议改进方案
获得最佳结果的技巧
对于图片:- 尽可能使用清晰的高分辨率图片
- 确保图片中的文本清晰可读
- 裁剪不必要的内容以获得更精准的结果
- 确保使用的是 Max 模型(其他模型不支持文件附件)
- 较小的 PDF 处理速度更快
- 格式良好、文本清晰的 PDF 效果最佳
- 考虑将非常大的 PDF 分成多个部分
- 提供代码用途的相关上下文
- 如果编程语言不明显,请注明
- 提出具体问题以获得更好的回答
相关文章
使用 Craft Assistant
学习使用助手的基础知识
自定义提示词
创建可重复使用的提示词,确保图片描述的一致性
选择 AI 模型
选择合适的模型来处理图片和 PDF
文档中的媒体
了解如何添加和管理图片及文件
代码块
获取 AI 辅助进行代码分析和调试