本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Bedrock 数据自动化功能的先决条件
BDA 的文件需要满足一些要求才能进行处理。下表显示了针对不同文件类型的这些要求。
|
要求说明 |
要求详细信息 |
|---|---|
|
(控制台)每个文档文件的最大页数 |
20 |
|
启用拆分器时,每个文档的最大页数 |
3000 |
|
(控制台)最大文件大小(MB) |
200 |
|
最大文件大小(MB) |
500 |
|
支持的文件格式 |
PDF、TIFF、JPEG、PNG、DOCX |
|
特定于 PDF 的限制 |
最大高度和宽度为 40 英寸和 9000 个点。 PDFs 无法使用密码保护。 PDFs 可以包含 JPEG 2000 格式的图像。 |
|
文档旋转和图像大小 |
BDA 支持所有平面内文档旋转,例如 45 度平面内旋转。 BDA 支持所有边的分辨率小于或等于 10000 像素的图像。 |
|
文本对齐方式 |
文本可以在文档中水平对齐。系统可以读取水平排列的文本,无论文档旋转到多少度。BDA 不支持文档中的垂直文本(垂直书写的文本,在日语和中文等语言中较为多见)对齐。 |
|
字符大小 |
可检测的文本的最小高度为 15 像素。在 150 DPI 时,这与 8 号字体相同。 |
|
字符类型 |
BDA 支持手写和打印字符识别。 |
注意
要处理 DOCX 文件,请将它们转换为 PDFs。这意味着页码映射不适用于 DOCX 文件。如果选择了 JSON+ 选项和页面粒度,则转换后的图像 PDFs 将上传到您的输出存储桶。
蓝图指令优化支持上述文档的所有限制,但有以下区别:
-
共有 10 个文档资产示例
-
控制台和 API 上每个文档资源示例 20 页
-
总文档资产示例 200MB
-
只有 PDF、DOCX 和 TIFF 文档文件格式
|
要求说明 |
要求详细信息 |
|---|---|
|
最大文件大小(MB) |
5 |
|
最大分辨率 |
8k |
|
支持的文件格式 |
JPEG、PNG |
|
要求说明 |
要求详细信息 |
|---|---|
|
最大文件大小(MB) |
10240 |
|
最大视频时长(分钟) |
240 |
|
支持的文件格式 |
MP4、带有 H.264、H.265/HEVC、、、、或 MPEG-4 Visual 视频编解码器的 MOV、AVI、 VP8 MKV 或 WEBM 容器格式 VP9 AV1 |
|
每个项目的最大视频蓝图数 |
1 |
|
每个启动推理请求的最大视频蓝图数 |
1 |
|
最小分辨率 |
224 |
|
最大分辨率 |
7680 |
|
最低帧率(每秒帧数) |
1 |
|
最高帧率(每秒帧数) |
60 |
|
要求说明 |
要求详细信息 |
|---|---|
|
支持的输入语言 |
英语、德国、西班牙语、法语、意大利语、葡萄牙语、日语、韩语、中文、台语和广东话。 *以上语言支持所有语言区域。 |
|
支持的输出语言 |
英语,或音频的主导语言。 |
|
最低音频采样率(Hz) |
8000 |
|
最高音频采样率(Hz) |
48000 |
|
最大文件大小(MB) |
2048 |
|
最大音频时长(分钟) |
240 |
|
最小音频时长(毫秒) |
500 |
|
支持的文件格式 |
AMR、FLAC、M4A、、Ogg、WAV MP3 |
|
每个项目的最大音频蓝图数 |
1 |
|
每个启动推理请求的最大音频蓝图数 |
1 |
|
音频文件的最大音频通道数 |
2 |