使用 Bedrock Data Automation 的先決條件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Bedrock Data Automation 的先決條件

BDA 的檔案必須符合特定要求,才能進行處理。下表顯示不同檔案類型的這些要求。

文件檔案需求

要求描述

要求詳細資訊

(主控台) 每個文件檔案的頁面數上限

20

啟用分割器時,每個文件的最大頁數

3000

(主控台) 檔案大小上限 (MB)

200

檔案大小上限 (MB)

500

支援檔案格式

PDF、TIFF、JPEG、PNG、DOCX

PDF 特定限制

高度和寬度上限為 40 英吋和 9000 點。PDF 無法受密碼保護。PDF 可包含 JPEG 2000 格式的影像。

文件旋轉和影像大小

BDA 支援所有平面內文件旋轉,例如 45 度平面內旋轉。

BDA 支援所有邊長的解析度均小於或等於 10000 像素的影像。

文字對齊

文字可以在文件中水平對齊文字。無論文件的旋轉角度為何,都可以讀取水平排列的文字。BDA 不支援文件中的垂直文字對齊 (垂直寫入的文字,在日文和中文等語言中很常見)。

字元大小

要偵測的文字最小高度為 15 像素。在 150 DPI 時,這與 8 點字型相同。

字元類型

BDA 支援手寫和列印字元辨識。

注意

若處理 DOCX 檔案,它們會轉換為 PDF。這表示頁碼映射不適用於 DOCX 檔案。如果選取 JSON+ 選項和頁面精細程度,則會將已轉換 PDF 的影像上傳至輸出儲存貯體。

藍圖指令最佳化支援具有下列差異的文件的所有上述限制:

  • 總共 10 個文件資產範例

  • 主控台和 API 上的每個文件資產範例 20 頁

  • 文件資產範例總計為 200MB

  • 只有 PDF、DOCX 和 TIFF 文件檔案格式

影像檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

5

最高解析度

8k

支援檔案格式

JPEG、PNG

影片檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

10240

影片長度上限 (分鐘)

240

支援檔案格式

MP4、MOV、AVI、MKV 或 WEBM 容器格式搭配 H.264、H.265/HEVC、VP8, VP9, AV1 或 MPEG-4 視訊轉碼器

每個專案的影片藍圖上限

1

每個啟動推論請求的影片藍圖上限

1

最低解析度

224

最高解析度

7680

最低影格率 (每秒影格數)

1

最高影格率 (每秒影格數)

60

音訊檔案需求

要求描述

要求詳細資訊

支援的輸入語言

英文、德國、西班牙文、法文、義大利文、葡萄牙文、日文、韓文、中文、國語和中文。

*上述語言支援的所有地區設定。

支援的輸出語言

英文或音訊的主要語言。

音訊取樣率下限 (Hz)

8000

最大音訊取樣率 (Hz)

48000

檔案大小上限 (MB)

2048

音訊長度上限 (分鐘)

240

音訊長度下限 (毫秒)

500

支援檔案格式

AMR、FLAC、M4A、MP3、Ogg、WAV

每個專案的音訊藍圖上限

1

每個啟動推論請求的音訊藍圖上限

1

音訊檔案的音訊聲道數上限

2