圖片和 PDF OCR 支援已在 3.3.5 版本中新增,輕鬆實現文字提取、標題產生和無障礙替代文字建立。
PDF 支援
AI 助理可以使用 Max 模型讀取和解析附加到文件中的 PDF 檔案。 PDF 可以做的事情:- 產生整份文件的摘要
- 就內容提出問題
- 提取關鍵要點或洞見
- 取得特定資訊
- 研究論文和文章
- 報告和白皮書
- 文件和手冊
- 會議記錄和簡報
圖片支援
AI 助理與圖片配合尤為出色,能為視覺內容提供快速結果。支援的圖片格式
- PNG
- JPG
- JPEG
- GIF
- WEBP
圖片可以做的事情
- 產生標題 – 為圖片建立描述性標題
- 取得摘要 – 瞭解圖片呈現的內容
- 建立詳細描述 – 產生深入的詮釋
- 提升無障礙性 – 為螢幕閱讀器產生替代文字
- 提取文字 – 從截圖或文件照片中取得文字
- 文件和指南
- 會議白板和圖表
- UI 或設計截圖
- 圖表和圖形
- 無障礙合規(替代文字產生)
使用 OCR 功能
助理將處理內容並即時提供結果。程式碼區塊
除了圖片和 PDF,AI 助理還可以協助處理程式碼區塊:- 說明程式碼的功能
- 協助除錯問題
- 闡明邏輯或結構
- 建議改進方案
獲得最佳結果的秘訣
對於圖片:- 盡可能使用清晰的高解析度圖片
- 確保圖片中的文字清晰可讀
- 裁剪不必要的內容以獲得更精準的結果
- 確保使用的是 Max 模型(其他模型不支援檔案附件)
- 較小的 PDF 處理速度更快
- 格式良好、文字清晰的 PDF 效果最佳
- 考慮將非常大的 PDF 分成多個部分
- 提供程式碼用途的相關背景
- 如果程式語言不明顯,請註明
- 提出具體問題以獲得更好的回答
相關文章
使用 Craft Assistant
學習使用助理的基礎知識
自訂提示詞
建立可重複使用的提示詞,確保圖片描述的一致性
選擇 AI 模型
選擇合適的模型來處理圖片和 PDF
文件中的媒體
瞭解如何新增和管理圖片及檔案
程式碼區塊
取得 AI 協助進行程式碼分析和除錯