本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
理解文件
注意
本文件適用於 Amazon Nova 第 1 版。如需 Amazon Nova 2 文件理解指南,請造訪文件理解。
Amazon Nova 的文件理解功能可讓您在提示中包含整份文件 (PDFs、Word 檔案、試算表等),並針對其內容提出問題或請求。Nova 的多模式理解模型 (Lite、Pro、Premier) 可以解譯這些文件中的文字和視覺元素 (例如圖表或資料表)。這可啟用例如問題回答、摘要和分析冗長報告或掃描文件等使用案例。主要功能包括適用於長文件的非常大型內容視窗 (1-2M 字符),以及能夠在單一查詢中處理多個文件。
Amazon Nova 區分兩種類型的文件輸入:
-
文字型文件類型 (例如 TXT、CSV、Markdown、HTML、DOC):這些主要針對其文字內容進行處理。Nova 將專注於了解這些文件中的文字並從中擷取資訊。
-
以媒體為基礎的文件類型 (例如 PDF、DOCX):這些檔案可能包含複雜的配置、影像、圖表或內嵌圖形。對於以媒體為基礎的文件,Nova 會同時處理視覺和文字元素。Nova 採用以視覺為基礎的理解來解譯視覺化內容,例如圖表、資料表、圖表或螢幕擷取畫面,以及文件的文字。
Amazon Nova 中的 PDF 檔案不支援 JPEG2000 和 JBIG2。
支援的檔案格式包括常見的文件類型:純文字和結構化文字檔案 (CSV、TXT)、試算表 (XLS/XLSX)、HTML/Markdown、Word 文件 (DOC/DOCX) 和 PDF 檔案。對於 文件內的影像,會處理標準影像格式 (PNG、JPG、GIF、WebP),但不支援包含特定影像編碼 (CYMK、SVG) 的 PDFs。
| 限制條件 | 限制 |
|---|---|
|
文件數量上限 |
每個請求最多 5 個文件 (適用於直接上傳和 Amazon S3) |
|
文字型文件大小 |
每個文字文件 (例如 .txt、.csv、.md、.html、.doc) 必須 ≤ 4.5 MB |
|
以媒體為基礎的文件大小 |
對於 .pdf 和 .docx 檔案,沒有個別檔案大小限制,但:
|
|
不支援的 PDF 內容 |
不支援包含 CMYK 顏色描述檔或 SVG 影像PDFs |