View a markdown version of this page

使用 Bedrock Data Automation 的先決條件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Bedrock Data Automation 的先決條件

BDA 的檔案必須符合特定要求,才能進行處理。下表顯示不同檔案類型的這些要求。

Async

非同步文件檔案需求

下表顯示使用叫用資料自動化非同步 API 處理之檔案的需求。

文件檔案需求

要求描述

要求詳細資訊

(主控台) 每個文件檔案的頁面數上限

20

啟用分割器時,每個文件的最大頁數

3000

(主控台) 檔案大小上限 (MB)

200

檔案大小上限 (MB)

500

支援檔案格式

PDF、TIFF、JPEG、PNG、DOCX

PDF 特定限制

高度和寬度上限為 40 英吋和 9000 點。PDF 無法受密碼保護。PDF 可包含 JPEG 2000 格式的影像。

文件旋轉和影像大小

BDA 支援所有平面內文件旋轉,例如 45 度平面內旋轉。

BDA 支援所有邊長的解析度均小於或等於 10000 像素的影像。

文字對齊

文字可以在文件中水平對齊文字。無論文件的旋轉角度為何,都可以讀取水平排列的文字。BDA 不支援文件中的垂直文字對齊 (垂直寫入的文字,在日文和中文等語言中很常見)。

字元大小

要偵測的文字最小高度為 15 像素。在 150 DPI 時,這與 8 點字型相同。

字元類型

BDA 支援手寫和列印字元辨識。

注意

若處理 DOCX 檔案,它們會轉換為 PDF。這表示頁碼映射不適用於 DOCX 檔案。如果選取 JSON+ 選項和頁面精細程度,則會將已轉換 PDF 的影像上傳至輸出儲存貯體。

藍圖指令最佳化支援具有下列差異的文件的所有上述限制:

  • 總共 10 個文件資產範例

  • 主控台和 API 上的每個文件資產範例 20 頁

  • 文件資產範例總計為 200MB

  • 只有 PDF、DOCX 和 TIFF 文件檔案格式

Sync

同步文件檔案需求

下表顯示使用調用資料自動化 API 處理之檔案的需求。

文件檔案需求

要求描述

要求詳細資訊

(主控台) 每個文件檔案的頁面數上限

10

每個文件檔案的頁面數上限 (無法使用 splitter)

10

(主控台) 檔案大小上限 (MB)

50

檔案大小上限 (MB)

50

支援檔案格式

PDF、TIFF、JPEG、PNG

PDF 特定限制

高度和寬度上限為 40 英吋和 9000 點。PDF 無法受密碼保護。PDF 可包含 JPEG 2000 格式的影像。

文件旋轉和影像大小

BDA 支援所有平面內文件旋轉,例如 45 度平面內旋轉。

BDA 支援所有邊長的解析度均小於或等於 10000 像素的影像。

文字對齊

文字可以在文件中水平對齊文字。無論文件的旋轉角度為何,都可以讀取水平排列的文字。BDA 不支援文件中的垂直文字對齊 (垂直寫入的文字,在日文和中文等語言中很常見)。

字元大小

要偵測的文字最小高度為 15 像素。在 150 DPI 時,這與 8 點字型相同。

字元類型

BDA 支援手寫和列印字元辨識。

注意

圖字幕適用於每 10 頁文件 (同步) 20 張影像和每頁 20 張影像 (非同步)。

提示

加速同步 API 處理的秘訣:

  • 除非絕對必要,否則請停用生成欄位。

  • 僅選取您需要的精細程度和輸出文字格式 (相較於選取多個)。

  • 簡化您的藍圖,盡可能減少擷取的欄位數量。

  • 盡可能減少藍圖中的資料表和清單欄位數量。

藍圖需求

要求描述

要求詳細資訊

每個專案的藍圖數目上限

40

每個帳戶的專案數量上限

100

每個帳戶的藍圖數目上限

1000

藍圖版本數目上限

100

藍圖分葉欄位數目上限

100

藍圖清單分葉欄位數目上限

30

藍圖名稱長度上限

60 個字元

藍圖欄位描述長度上限

600 個字元 (文件)、500 個字元 (image/video/audio)

藍圖欄位名稱長度上限

60 個字元

藍圖大小上限

100,000 個字元 (JSON 格式)

影像檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

5

最高解析度

8k

支援檔案格式

JPEG、PNG

影片檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

10240

影片長度上限 (分鐘)

240

支援檔案格式

MP4、MOV、AVI、MKV 或 WEBM 容器格式搭配 H.264、H.265/HEVC、VP8, VP9, AV1 或 MPEG-4 視訊轉碼器

每個專案的影片藍圖上限

1

每個啟動推論請求的影片藍圖上限

1

最低解析度

224

最高解析度

7680

最低影格率 (每秒影格數)

1

最高影格率 (每秒影格數)

60

音訊檔案需求

要求描述

要求詳細資訊

支援的輸入語言

英文、德國、西班牙文、法文、義大利文、葡萄牙文、日文、韓文、中文、國語和中文。

*上述語言支援的所有地區設定。

支援的輸出語言

英文或音訊的主要語言。

音訊取樣率下限 (Hz)

8000

最大音訊取樣率 (Hz)

48000

檔案大小上限 (MB)

2048

音訊長度上限 (分鐘)

240

音訊長度下限 (毫秒)

500

支援檔案格式

AMR、FLAC、M4A、MP3、Ogg、WAV

每個專案的音訊藍圖上限

1

每個啟動推論請求的音訊藍圖上限

1

音訊檔案的音訊聲道數上限

2