

# 文档理解
<a name="modalities-document"></a>

**注意**  
本文档适用于 Amazon Nova 版本 1。如需 Amazon Nova 2 文档理解指南，请访问[文档理解](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html#document-understanding)。

借助于 Amazon Nova 的文档理解功能，您可以在提示中包含整个文档（PDF、Word 文件、电子表格等），并就其内容提出问题或发出请求。Nova 的多模态理解模型（Lite、Pro、Premier）可解释这些文档中的文本和视觉元素（例如图表或表格）。这支持多种用例，比如对冗长报告或扫描文档进行问答、概括和分析。主要功能包括用于容纳长文档的超大上下文窗口（1-2M 个词元），以及在一次查询中处理多个文档的能力。

Amazon Nova 区分了以下两种类型的文档输入：
+ **基于文本的文档类型**（例如 TXT、CSV、Markdown、HTML、DOC）：对于这些文档，主要处理其文本内容。Nova 将专注于理解这些文档的文本并从中提取信息。
+ **基于媒体的文档类型**（例如 PDF、DOCX）：这些文件可能含有复杂的布局、图像、图表或嵌入式图形。对于基于媒体的文档，Nova 同时处理其视觉和文本元素。Nova 采用基于视觉的理解功能来解释文档文本旁边的视觉内容，例如图表、表格、示意图或屏幕截图。

  Amazon Nova 中的 PDF 文件不支持 JPEG2000 和 JBIG2。

支持的文件格式包括常见文档类型：纯文本和结构化文本文件（CSV、TXT）、电子表格（XLS/XLSX）、HTML/MarkDown、Word 文档（DOC/DOCX）和 PDF 文件。对于文档中的图像，可处理标准图像格式（PNG、JPG、GIF、WebP），但不支持含有某些图像编码（CYMK、SVG）的 PDF。


**文档大小限制和使用指南**  

| 约束 | 限制 | 
| --- | --- | 
|  最大文档数  |  每个请求最多 5 份文档（适用于直接上传和 Amazon S3）  | 
|  基于文本的文档大小  |  每个文本文档（例如 .txt、.csv、.md、.html、.doc）不能超过 4.5 MB  | 
|  基于媒体的文档大小  |  .pdf 和.docx 文件没有单独的文件大小限制，但是： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/nova/latest/userguide/modalities-document.html)  | 
|  不支持的 PDF 内容  |  不支持含有 CMYK 颜色配置文件或 SVG 图像的 PDF  | 