メインコンテンツへスキップ
CraftのAIアシスタントは、ドキュメント内の画像やPDFを直接理解、要約、説明するのに役立ちます。対応するコンテンツにカーソルを合わせると、すぐに操作できるクイックアクションボタンが表示されます。
画像とPDFのOCRサポートがバージョン3.3.5で追加され、テキストの抽出、キャプションの生成、アクセシビリティ向けの代替テキストの作成が簡単にできるようになりました。

PDFサポート

AIアシスタントは、Maxモデルを使用して、ドキュメントに添付されたPDFファイルを読み取り、解釈できます。 PDFでできること:
  • ドキュメント全体の要約を生成
  • コンテンツに関する質問
  • 重要なポイントやインサイトの抽出
  • 特定の情報の取得
以下のような場面で特に便利です:
  • 研究論文や記事
  • レポートやホワイトペーパー
  • ドキュメントやマニュアル
  • 会議メモやプレゼンテーション

画像サポート

AIアシスタントは画像との相性が特に良く、ビジュアルコンテンツに対して素早い結果を提供します。

対応する画像フォーマット

  • PNG
  • JPG
  • JPEG
  • GIF
  • WEBP
HEIC画像は現在サポートされていません。アシスタントで使用する前に、HEICファイルをJPGまたはPNGに変換してください。

画像でできること

  • キャプションを生成 – 画像の説明的なキャプションを作成
  • 要約を取得 – 画像の内容を理解
  • 詳細な説明を作成 – 詳しい解釈を生成
  • アクセシビリティを向上 – スクリーンリーダー向けの代替テキストを生成
  • テキストを抽出 – スクリーンショットやドキュメントの写真からテキストを取得
活用シーン:
  • ドキュメントやガイド
  • 会議のホワイトボードや図表
  • UIやデザインのスクリーンショット
  • チャートやグラフ
  • アクセシビリティ対応(代替テキスト生成)

OCR機能の使い方

1
ドキュメントに画像またはPDFを追加します。
2
画像またはPDFブロックにカーソルを合わせます。
3
表示されるアシスタントのクイックアクションボタンをクリックします。
4
実行したい操作を選択します:キャプション生成、要約、テキスト抽出、またはカスタム質問。
アシスタントがコンテンツを処理し、即座に結果を提供します。

コードブロック

画像やPDFに加えて、AIアシスタントはコードブロックでも活用できます:
  • コードの動作を説明
  • デバッグの支援
  • ロジックや構造の解説
  • 改善の提案
これにより、Craftは技術文書や開発メモに強力なツールとなります。

より良い結果を得るためのヒント

画像の場合:
  • できるだけ鮮明で高解像度の画像を使用
  • 画像内のテキストが読みやすいことを確認
  • 不要な部分をトリミングして、より的確な結果を取得
PDFの場合:
  • Maxモデルを使用していることを確認(他のモデルはファイル添付に対応していません)
  • 小さいPDFほど処理が速い
  • テキストが明確で整形されたPDFが最適
  • 非常に大きなPDFはセクションに分割することを検討
コードの場合:
  • コードが何をすべきかのコンテキストを含める
  • プログラミング言語が明確でない場合は指定する
  • より良い回答を得るために具体的な質問をする

関連記事

Craft Assistantの使い方

アシスタントの基本的な使い方を学ぶ

カスタムプロンプト

一貫した画像説明のための再利用可能なプロンプトを作成

AIモデルの選択

画像やPDFの処理に適したモデルを選択

ドキュメント内のメディア

画像やファイルの追加・管理方法を学ぶ

コードブロック

コードの分析やデバッグでAIの支援を受ける