跳轉到主要內容
Craft 的 AI 助理可以幫助你直接在文件中理解、摘要和描述圖片和 PDF。當你將滑鼠懸停在支援的內容上時,會出現快速操作按鈕,讓你可以即時互動。
圖片和 PDF OCR 支援已在 3.3.5 版本中新增,輕鬆實現文字提取、標題產生和無障礙替代文字建立。

PDF 支援

AI 助理可以使用 Max 模型讀取和解析附加到文件中的 PDF 檔案。 PDF 可以做的事情:
  • 產生整份文件的摘要
  • 就內容提出問題
  • 提取關鍵要點或洞見
  • 取得特定資訊
這在以下場景中特別有用:
  • 研究論文和文章
  • 報告和白皮書
  • 文件和手冊
  • 會議記錄和簡報

圖片支援

AI 助理與圖片配合尤為出色,能為視覺內容提供快速結果。

支援的圖片格式

  • PNG
  • JPG
  • JPEG
  • GIF
  • WEBP
目前不支援 HEIC 圖片。在使用助理之前,請將 HEIC 檔案轉換為 JPG 或 PNG。

圖片可以做的事情

  • 產生標題 – 為圖片建立描述性標題
  • 取得摘要 – 瞭解圖片呈現的內容
  • 建立詳細描述 – 產生深入的詮釋
  • 提升無障礙性 – 為螢幕閱讀器產生替代文字
  • 提取文字 – 從截圖或文件照片中取得文字
使用場景:
  • 文件和指南
  • 會議白板和圖表
  • UI 或設計截圖
  • 圖表和圖形
  • 無障礙合規(替代文字產生)

使用 OCR 功能

1
將圖片或 PDF 加入文件中。
2
將滑鼠懸停在圖片或 PDF 區塊上。
3
點擊出現的助理快速操作按鈕。
4
選擇你想要執行的操作:產生標題、摘要、提取文字或提出自訂問題。
助理將處理內容並即時提供結果。

程式碼區塊

除了圖片和 PDF,AI 助理還可以協助處理程式碼區塊
  • 說明程式碼的功能
  • 協助除錯問題
  • 闡明邏輯或結構
  • 建議改進方案
這使 Craft 成為技術文件和開發筆記的強大工具。

獲得最佳結果的秘訣

對於圖片:
  • 盡可能使用清晰的高解析度圖片
  • 確保圖片中的文字清晰可讀
  • 裁剪不必要的內容以獲得更精準的結果
對於 PDF:
  • 確保使用的是 Max 模型(其他模型不支援檔案附件)
  • 較小的 PDF 處理速度更快
  • 格式良好、文字清晰的 PDF 效果最佳
  • 考慮將非常大的 PDF 分成多個部分
對於程式碼:
  • 提供程式碼用途的相關背景
  • 如果程式語言不明顯,請註明
  • 提出具體問題以獲得更好的回答

相關文章

使用 Craft Assistant

學習使用助理的基礎知識

自訂提示詞

建立可重複使用的提示詞,確保圖片描述的一致性

選擇 AI 模型

選擇合適的模型來處理圖片和 PDF

文件中的媒體

瞭解如何新增和管理圖片及檔案

程式碼區塊

取得 AI 協助進行程式碼分析和除錯