在 v3.3.5 版本中新增了图像和 PDF 的 OCR 支持,方便提取文本、生成说明文字并为无障碍提供替代文本。
PDF 支持
AI 助手 可以读取并解释附加到你文档中的 PDF 文件。 你可以对 PDF 执行的操作:- 生成整篇文档的摘要
- 针对内容提问
- 提取关键点或见解
- 抽取特定信息
- 学术论文与文章
- 报告与白皮书
- 文档与手册
- 会议记录与演示文稿
图像支持
AI 助手 对图像处理效果尤佳,可为视觉内容提供快速结果。支持的图像格式
- PNG
- JPG
- JPEG
- GIF
- WEBP
你可以对图像执行的操作
- 生成说明文字 – 为图像创建描述性说明
- 获取摘要 – 理解图像所展示的内容
- 创建详细描述 – 生成深入的图像解读
- 提升无障碍性 – 为屏幕阅读器生成替代文本
- 提取文本 – 从截图或拍照的文档中提取文本
- 文档与指南
- 会议白板与图表
- UI 或设计的屏幕截图
- 图表与数据可视化
- 无障碍合规(生成替代文本)
使用 OCR 功能
AI 助手 会处理内容并立即提供结果。代码块
除了图像和 PDF,AI 助手 还可以帮助处理 代码块:- 解释代码的功能
- 协助调试问题
- 澄清逻辑或结构
- 提出改进建议
提升效果的建议
针对图像:- 尽量使用清晰、高分辨率的图像
- 确保图像中的文字可读
- 裁剪掉无关内容以获得更聚焦的结果
- 较小的 PDF 处理更快
- 排版良好、文字清晰的 PDF 效果最佳
- 如遇超大 PDF,可考虑拆分为若干部分
- 提供代码应完成的上下文信息
- 若语言不明显,请说明编程语言
- 提出具体问题以获得更精确的答复