ドキュメント理解
注記
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 ドキュメント理解ガイドについては、「ドキュメントの理解」を参照してください。
Amazon Nova のドキュメント理解機能を使用すると、プロンプトにドキュメント全体 (PDF、Word ファイル、スプレッドシートなど) を含め、そのコンテンツに関する質問やリクエストを行うことができます。Nova のマルチモーダル理解モデル (Lite、Pro、Premier) は、これらのドキュメント内のテキスト要素とビジュアル要素 (グラフやテーブルなど) の両方を解釈できます。これにより、質問応答、要約、長いレポートやスキャンされたドキュメントの分析などのユースケースに対応できるようになります。主な機能には、長いドキュメント用の非常に大きなコンテキストウィンドウ (1~200 万トークン) や、1 つのクエリで複数のドキュメントを処理する機能などがあります。
Amazon Nova は、次の 2 種類のドキュメント入力を区別します。
-
テキストベースのドキュメントタイプ (TXT、CSV、Markdown、HTML、DOC など): これらは主にテキストコンテンツに対して処理されます。Nova は、これらのドキュメントのテキストからの情報の理解と抽出に焦点を当てます。
-
メディアベースのドキュメントタイプ (PDF、DOCX など): これらのファイルには、複雑なレイアウト、画像、グラフ、または埋め込みグラフィックが含まれている場合があります。メディアベースのドキュメントの場合、Nova はビジュアル要素とテキスト要素の両方を処理します。Nova は、ビジョンベースの理解を使用して、グラフ、テーブル、図、スクリーンショットなどのビジュアルコンテンツをドキュメントのテキストとともに解釈します。
JPEG2000 および JBIG2 は、Amazon Nova の PDF ファイルではサポートされていません。
サポートされているファイル形式には、プレーンテキストファイルと構造化テキストファイル (CSV、TXT)、スプレッドシート (XLS/XLSX)、HTML/Markdown、Word ドキュメント (DOC/DOCX)、PDF ファイルなどの一般的なドキュメントタイプがあります。ドキュメント内の画像については、標準画像形式 (PNG、JPG、GIF、WebP) は処理されますが、特定の画像エンコーディング (CYMK、SVG) を含む PDF はサポートされていません。
| 制約 | 制限 |
|---|---|
|
ドキュメントの最大数 |
リクエストごとに最大 5 つのドキュメント (直接アップロードと Amazon S3 の両方に適用) |
|
テキストベースのドキュメントサイズ |
各テキストドキュメント (.txt、.csv、.md、.html、.doc など) は 4.5 MB 以下である必要があります |
|
メディアベースのドキュメントサイズ |
.pdf ファイルと .docx ファイルの場合、個別のファイルサイズ制限はありませんが、以下が適用されます。
|
|
サポートされていない PDF コンテンツ |
CMYK カラープロファイルまたは SVG 画像を含む PDF はサポートされていません |