画像とPDFのOCRサポートがバージョン3.3.5で追加され、テキストの抽出、キャプションの生成、アクセシビリティ向けの代替テキストの作成が簡単にできるようになりました。
PDFサポート
AIアシスタントは、Maxモデルを使用して、ドキュメントに添付されたPDFファイルを読み取り、解釈できます。 PDFでできること:- ドキュメント全体の要約を生成
- コンテンツに関する質問
- 重要なポイントやインサイトの抽出
- 特定の情報の取得
- 研究論文や記事
- レポートやホワイトペーパー
- ドキュメントやマニュアル
- 会議メモやプレゼンテーション
画像サポート
AIアシスタントは画像との相性が特に良く、ビジュアルコンテンツに対して素早い結果を提供します。対応する画像フォーマット
- PNG
- JPG
- JPEG
- GIF
- WEBP
画像でできること
- キャプションを生成 – 画像の説明的なキャプションを作成
- 要約を取得 – 画像の内容を理解
- 詳細な説明を作成 – 詳しい解釈を生成
- アクセシビリティを向上 – スクリーンリーダー向けの代替テキストを生成
- テキストを抽出 – スクリーンショットやドキュメントの写真からテキストを取得
- ドキュメントやガイド
- 会議のホワイトボードや図表
- UIやデザインのスクリーンショット
- チャートやグラフ
- アクセシビリティ対応(代替テキスト生成)
OCR機能の使い方
アシスタントがコンテンツを処理し、即座に結果を提供します。
コードブロック
画像やPDFに加えて、AIアシスタントはコードブロックでも活用できます:- コードの動作を説明
- デバッグの支援
- ロジックや構造の解説
- 改善の提案
より良い結果を得るためのヒント
画像の場合:- できるだけ鮮明で高解像度の画像を使用
- 画像内のテキストが読みやすいことを確認
- 不要な部分をトリミングして、より的確な結果を取得
- Maxモデルを使用していることを確認(他のモデルはファイル添付に対応していません)
- 小さいPDFほど処理が速い
- テキストが明確で整形されたPDFが最適
- 非常に大きなPDFはセクションに分割することを検討
- コードが何をすべきかのコンテキストを含める
- プログラミング言語が明確でない場合は指定する
- より良い回答を得るために具体的な質問をする
関連記事
Craft Assistantの使い方
アシスタントの基本的な使い方を学ぶ
カスタムプロンプト
一貫した画像説明のための再利用可能なプロンプトを作成
AIモデルの選択
画像やPDFの処理に適したモデルを選択
ドキュメント内のメディア
画像やファイルの追加・管理方法を学ぶ
コードブロック
コードの分析やデバッグでAIの支援を受ける