

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Bedrock 数据自动化功能的先决条件
<a name="bda-limits"></a>

BDA 的文件需要满足一些要求才能进行处理。下表显示了针对不同文件类型的这些要求。

------
#### [ Async ]

**异步文档文件要求**

下表显示了使用调用数据自动化异步 API 处理的文件的要求。


**文档文件要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  （控制台）每个文档文件的最大页数  |  20  | 
|  启用拆分器时，每个文档的最大页数  |  3000  | 
|  （控制台）最大文件大小（MB）  |  200  | 
|  最大文件大小（MB）  |  500  | 
|  支持的文件格式  |  PDF、TIFF、JPEG、PNG、DOCX  | 
|  特定于 PDF 的限制  |  最大高度和宽度为 40 英寸和 9000 个点。 PDFs 无法使用密码保护。 PDFs 可以包含 JPEG 2000 格式的图像。  | 
|  文档旋转和图像大小  |  BDA 支持所有平面内文档旋转，例如 45 度平面内旋转。 BDA 支持所有边的分辨率小于或等于 10000 像素的图像。  | 
|  文本对齐方式  |   文本可以在文档中水平对齐。系统可以读取水平排列的文本，无论文档旋转到多少度。BDA 不支持文档中的垂直文本（垂直书写的文本，在日语和中文等语言中较为多见）对齐。  | 
|  字符大小  |  可检测的文本的最小高度为 15 像素。在 150 DPI 时，这与 8 号字体相同。  | 
|  字符类型  |  BDA 支持手写和打印字符识别。  | 

**注意**  
要处理 DOCX 文件，请将它们转换为 PDFs。这意味着页码映射不适用于 DOCX 文件。如果选择了 JSON\$1 选项和页面粒度，则转换后的图像 PDFs 将上传到您的输出存储桶。

蓝图指令优化支持上述文档的所有限制，但有以下区别：
+ 共有 10 个文档资产示例
+ 控制台和 API 上每个文档资源示例 20 页
+ 总文档资产示例 200MB
+ 只有 PDF、DOCX 和 TIFF 文档文件格式

------
#### [ Sync ]

**同步文档文件要求**

下表显示了使用调用数据自动化 API 处理的文件的要求。


**文档文件要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  （控制台）每个文档文件的最大页数  |  10  | 
|  每个文档文件的最大页数（分割器不可用）  |  10  | 
|  （控制台）最大文件大小（MB）  |  50  | 
|  最大文件大小（MB）  |  50  | 
|  支持的文件格式  |  PDF、TIFF、JPEG、PNG  | 
|  特定于 PDF 的限制  |  最大高度和宽度为 40 英寸和 9000 个点。 PDFs 无法使用密码保护。 PDFs 可以包含 JPEG 2000 格式的图像。  | 
|  文档旋转和图像大小  |  BDA 支持所有平面内文档旋转，例如 45 度平面内旋转。 BDA 支持所有边的分辨率小于或等于 10000 像素的图像。  | 
|  文本对齐方式  |   文本可以在文档中水平对齐。系统可以读取水平排列的文本，无论文档旋转到多少度。BDA 不支持文档中的垂直文本（垂直书写的文本，在日语和中文等语言中较为多见）对齐。  | 
|  字符大小  |  可检测的文本的最小高度为 15 像素。在 150 DPI 时，这与 8 号字体相同。  | 
|  字符类型  |  BDA 支持手写和打印字符识别。  | 

**注意**  
人物标题适用于每 10 页文档 20 张图像（同步）和每页 20 张图像（异步）。

**提示**  
加快同步 API 处理速度的提示：  
除非绝对必要，否则请禁用生成字段。
仅选择所需的粒度和输出文本格式（而不是选择多个）。
简化蓝图以尽可能减少提取的字段数量。
尽可能减少蓝图中表格和列表字段的数量。

------


**蓝图要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  每个项目的最大蓝图数量  |  40  | 
|  每个账户的最大项目数  |  100  | 
|  每个账户的最大蓝图数量  |  1000  | 
|  蓝图版本的最大数量  |  100  | 
|  蓝图叶字段的最大数量  |  100  | 
|  蓝图列表叶字段的最大数量  |  30  | 
|  蓝图名称的最大长度  |  60 个字符  | 
|  蓝图字段描述的最大长度  |  600 个字符（文档），500 个字符（image/video/audio）  | 
|  蓝图字段名称的最大长度  |  60 个字符  | 
|  最大蓝图大小  |  10 万个字符（JSON 格式）  | 


**图像文件要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  最大文件大小（MB）  |  5  | 
|  最大分辨率  |  8k  | 
|  支持的文件格式  |  JPEG、PNG  | 


**视频文件要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  最大文件大小（MB）  |  10240  | 
|  最大视频时长（分钟）  |  240  | 
|  支持的文件格式  |  MP4、带有 H.264、H.265/HEVC、、、、或 MPEG-4 Visual 视频编解码器的 MOV、AVI、 VP8 MKV 或 WEBM 容器格式 VP9 AV1  | 
|  每个项目的最大视频蓝图数  |  1  | 
|  每个启动推理请求的最大视频蓝图数  |  1  | 
|  最小分辨率  |  224  | 
|  最大分辨率  |  7680  | 
|  最低帧率（每秒帧数）  |  1  | 
|  最高帧率（每秒帧数）  |  60  | 


**音频文件要求**  

|  要求说明  |  要求详细信息  | 
| --- | --- | 
|  支持的输入语言  |  英语、德国、西班牙语、法语、意大利语、葡萄牙语、日语、韩语、中文、台语和广东话。 *\$1以上语言支持所有语言区域。*  | 
|  支持的输出语言  |  英语，或音频的主导语言。  | 
|  最低音频采样率（Hz）  |  8000  | 
|  最高音频采样率（Hz）  |  48000  | 
|  最大文件大小（MB）  |  2048  | 
|  最大音频时长（分钟）  |  240  | 
|  最小音频时长（毫秒）  |  500  | 
|  支持的文件格式  |  AMR、FLAC、M4A、、Ogg、WAV MP3  | 
|  每个项目的最大音频蓝图数  |  1  | 
|  每个启动推理请求的最大音频蓝图数  |  1  | 
|  音频文件的最大音频通道数  |  2  | 