使用 Bedrock 数据自动化功能的先决条件 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Bedrock 数据自动化功能的先决条件

BDA 的文件需要满足一些要求才能进行处理。下表显示了针对不同文件类型的这些要求。

文档文件要求

要求说明

要求详细信息

(控制台)每个文档文件的最大页数

20

启用拆分器时,每个文档的最大页数

3000

(控制台)最大文件大小(MB)

200

最大文件大小(MB)

500

支持的文件格式

PDF、TIFF、JPEG、PNG、DOCX

特定于 PDF 的限制

最大高度和宽度为 40 英寸和 9000 个点。 PDFs 无法使用密码保护。 PDFs 可以包含 JPEG 2000 格式的图像。

文档旋转和图像大小

BDA 支持所有平面内文档旋转,例如 45 度平面内旋转。

BDA 支持所有边的分辨率小于或等于 10000 像素的图像。

文本对齐方式

文本可以在文档中水平对齐。系统可以读取水平排列的文本,无论文档旋转到多少度。BDA 不支持文档中的垂直文本(垂直书写的文本,在日语和中文等语言中较为多见)对齐。

字符大小

可检测的文本的最小高度为 15 像素。在 150 DPI 时,这与 8 号字体相同。

字符类型

BDA 支持手写和打印字符识别。

注意

要处理 DOCX 文件,请将它们转换为 PDFs。这意味着页码映射不适用于 DOCX 文件。如果选择了 JSON+ 选项和页面粒度,则转换后的图像 PDFs 将上传到您的输出存储桶。

蓝图指令优化支持上述文档的所有限制,但有以下区别:

  • 共有 10 个文档资产示例

  • 控制台和 API 上每个文档资源示例 20 页

  • 总文档资产示例 200MB

  • 只有 PDF、DOCX 和 TIFF 文档文件格式

图像文件要求

要求说明

要求详细信息

最大文件大小(MB)

5

最大分辨率

8k

支持的文件格式

JPEG、PNG

视频文件要求

要求说明

要求详细信息

最大文件大小(MB)

10240

最大视频时长(分钟)

240

支持的文件格式

MP4、带有 H.264、H.265/HEVC、、、、或 MPEG-4 Visual 视频编解码器的 MOV、AVI、 VP8 MKV 或 WEBM 容器格式 VP9 AV1

每个项目的最大视频蓝图数

1

每个启动推理请求的最大视频蓝图数

1

最小分辨率

224

最大分辨率

7680

最低帧率(每秒帧数)

1

最高帧率(每秒帧数)

60

音频文件要求

要求说明

要求详细信息

支持的输入语言

英语、德国、西班牙语、法语、意大利语、葡萄牙语、日语、韩语、中文、台语和广东话。

*以上语言支持所有语言区域。

支持的输出语言

英语,或音频的主导语言。

最低音频采样率(Hz)

8000

最高音频采样率(Hz)

48000

最大文件大小(MB)

2048

最大音频时长(分钟)

240

最小音频时长(毫秒)

500

支持的文件格式

AMR、FLAC、M4A、、Ogg、WAV MP3

每个项目的最大音频蓝图数

1

每个启动推理请求的最大音频蓝图数

1

音频文件的最大音频通道数

2