本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Bedrock Data Automation 的先決條件
BDA 的檔案必須符合特定要求,才能進行處理。下表顯示不同檔案類型的這些要求。
|
要求描述 |
要求詳細資訊 |
|---|---|
|
(主控台) 每個文件檔案的頁面數上限 |
20 |
|
啟用分割器時,每個文件的最大頁數 |
3000 |
|
(主控台) 檔案大小上限 (MB) |
200 |
|
檔案大小上限 (MB) |
500 |
|
支援檔案格式 |
PDF、TIFF、JPEG、PNG、DOCX |
|
PDF 特定限制 |
高度和寬度上限為 40 英吋和 9000 點。PDF 無法受密碼保護。PDF 可包含 JPEG 2000 格式的影像。 |
|
文件旋轉和影像大小 |
BDA 支援所有平面內文件旋轉,例如 45 度平面內旋轉。 BDA 支援所有邊長的解析度均小於或等於 10000 像素的影像。 |
|
文字對齊 |
文字可以在文件中水平對齊文字。無論文件的旋轉角度為何,都可以讀取水平排列的文字。BDA 不支援文件中的垂直文字對齊 (垂直寫入的文字,在日文和中文等語言中很常見)。 |
|
字元大小 |
要偵測的文字最小高度為 15 像素。在 150 DPI 時,這與 8 點字型相同。 |
|
字元類型 |
BDA 支援手寫和列印字元辨識。 |
注意
若處理 DOCX 檔案,它們會轉換為 PDF。這表示頁碼映射不適用於 DOCX 檔案。如果選取 JSON+ 選項和頁面精細程度,則會將已轉換 PDF 的影像上傳至輸出儲存貯體。
藍圖指令最佳化支援具有下列差異的文件的所有上述限制:
-
總共 10 個文件資產範例
-
主控台和 API 上的每個文件資產範例 20 頁
-
文件資產範例總計為 200MB
-
只有 PDF、DOCX 和 TIFF 文件檔案格式
|
要求描述 |
要求詳細資訊 |
|---|---|
|
檔案大小上限 (MB) |
5 |
|
最高解析度 |
8k |
|
支援檔案格式 |
JPEG、PNG |
|
要求描述 |
要求詳細資訊 |
|---|---|
|
檔案大小上限 (MB) |
10240 |
|
影片長度上限 (分鐘) |
240 |
|
支援檔案格式 |
MP4、MOV、AVI、MKV 或 WEBM 容器格式搭配 H.264、H.265/HEVC、VP8, VP9, AV1 或 MPEG-4 視訊轉碼器 |
|
每個專案的影片藍圖上限 |
1 |
|
每個啟動推論請求的影片藍圖上限 |
1 |
|
最低解析度 |
224 |
|
最高解析度 |
7680 |
|
最低影格率 (每秒影格數) |
1 |
|
最高影格率 (每秒影格數) |
60 |
|
要求描述 |
要求詳細資訊 |
|---|---|
|
支援的輸入語言 |
英文、德國、西班牙文、法文、義大利文、葡萄牙文、日文、韓文、中文、國語和中文。 *上述語言支援的所有地區設定。 |
|
支援的輸出語言 |
英文或音訊的主要語言。 |
|
音訊取樣率下限 (Hz) |
8000 |
|
最大音訊取樣率 (Hz) |
48000 |
|
檔案大小上限 (MB) |
2048 |
|
音訊長度上限 (分鐘) |
240 |
|
音訊長度下限 (毫秒) |
500 |
|
支援檔案格式 |
AMR、FLAC、M4A、MP3、Ogg、WAV |
|
每個專案的音訊藍圖上限 |
1 |
|
每個啟動推論請求的音訊藍圖上限 |
1 |
|
音訊檔案的音訊聲道數上限 |
2 |