Bedrock Data Automation を使用するための前提条件 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Bedrock Data Automation を使用するための前提条件

BDA のファイルは、処理に向けて特定の要件を満たす必要があります。次の表は、さまざまなファイルタイプについての要件を説明しています。

ドキュメントファイルの要件

要件の説明

要件の詳細

(コンソール) ドキュメントファイルあたりの最大ページ数

20

分割機能が有効である間のドキュメントあたりの最大ページ数

3000

(コンソール) 最大ファイル容量 (MB 単位)

200

最大ファイルサイズ (MB 単位)

500

サポートされるファイル形式

PDF、TIFF、JPEG、PNG、DOCX

PDF 固有の制限

最大高さと最大幅は、40 インチ、9,000 ポイント。PDF はパスワードでの保護不可。PDF には JPEG 2000 形式の画像を含めることができる。

ドキュメントの回転と画像サイズ

BDA は、45 度の平面内回転など、ドキュメントのあらゆる平面内回転をサポートする。

BDAは、全辺が 10,000 ピクセル以下の解像度の画像をサポートする。

テキストの配置

テキストは文書内で横書きで配置できる。横書きに配列したテキストは、ドキュメントの回転角度を問わず、読み取ることができる。BDA は、ドキュメント内の縦書きテキスト (日本語や中国語などの言語で一般的な、垂直方向に記述されたテキスト) の配置はサポートしていない。

文字サイズ

検出されるテキストの最小の高さは 15 ピクセル。150 DPI の場合、これは 8 ポイントフォントと同じサイズ。

文字タイプ

BDA は、手書き文字認識と印刷文字認識の両方をサポートする。

注記

DOCX ファイルの処理では、PDF に変換される。このため、ページ番号マッピングは DOCX ファイルでは機能しない。JSON+ オプションとページの粒度が選択されている場合、変換された PDF の画像は出力バケットにアップロードされる。

ブループリント命令の最適化は、以下の違いがあるドキュメントに対して上記のすべての制限をサポートしています。

  • 合計 10 個のドキュメントアセットの例

  • コンソールと API でのドキュメントアセット例あたり 20 ページ

  • ドキュメントアセットの合計例の 200MB

  • PDF、DOCX、TIFF ドキュメントファイル形式のみ

画像ファイルの要件

要件の説明

要件の詳細

最大ファイルサイズ (MB 単位)

5

最大解像度

8k

サポートされるファイル形式

JPEG、PNG

動画ファイルの要件

要件の説明

要件の詳細

最大ファイルサイズ (MB 単位)

10240

動画の最大長 (分単位)

240

サポートされるファイル形式

H.264、H.265/HEVC、VP8、VP9、AV1、または MPEG-4 ビジュアルビデオコーデックを使用した MP4、MOV、AVI、MKV、または WEBM のコンテナ形式

プロジェクトあたりの動画ブループリントの最大数

1

推論開始リクエストあたりの動画ブループリントの最大数

1

最小解像度

224

最大解像度

7680

最小フレームレート (フレーム/秒)

1

最大フレームレート (フレーム/秒)

60

音声ファイルの要件

要件の説明

要件の詳細

サポートされている入力言語

英語、ドイツ語、スペイン語、フランス語、イタリア語、ポルトガル語、日本語、韓国語、中国語、台湾語、広東語。

*上記の言語でサポートされているすべてのロケール。

サポートされている出力言語

英語、またはオーディオの主要言語。

最小音声サンプルレート (Hz)

8000

最大音声サンプルレート (Hz)

48000

最大ファイルサイズ (MB 単位)

2048

音声の最大長 (分単位)

240

最小音声長 (ミリ秒)

500

サポートされるファイル形式

AMR、FLAC、M4A、MP3、Ogg、WAV

プロジェクトあたりの最大音声ブループリント

1

推論開始リクエストあたりの最大音声ブループリント

1

音声ファイルの最大音声チャネル

2