プロビジョンドスループット - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

プロビジョンドスループット

モデルにプロビジョンドスループットを設定すると、一定レベルのスループットが固定コストで得られます。

プロビジョンドスループットは、Amazon やサードパーティーのベースモデル、およびカスタマイズモデルで使用できます。

プロビジョンドスループットの料金は、使用するモデルと選択するコミットメント (契約) のレベルによって異なります。より長い期間にわたって契約すると、割引料金が適用されます。各モデルの料金の詳細については、Amazon Bedrock コンソールの「モデルプロバイダー」ページを参照してください。

モデルのスループットのオプションは、推論をベースモデルで実行するか、カスタムモデルで実行するかによって異なります。

注記

AWS GovCloud (US) リージョンでは、コミットメントなしでカスタムモデルのプロビジョンドスループットのみを購入できます。

料金オプション ベースモデル カスタムモデル
プロビジョンドスループット、コミットメントなし (時間単位の料金) 利用不可 利用可能 (アカウントあたり最大 2 つのプロビジョンドスループット)
プロビジョンドスループット、1 か月間のコミットメント 利用可能 利用可能
プロビジョンドスループット、6 か月間のコミットメント 利用可能 利用可能

プロビジョンドスループットはモデルユニット (MU) 数で指定します。モデルユニットは、指定されたモデルに対する特定のスループットレベルを提供します。特定のテキストモデルに対する MU のスループットレベルでは、以下を指定します。

  • 1 分あたりの入力トークンの総数 - 1 分以内にすべてのリクエストに対して MU が処理できる入力トークンの数。

  • 1 分あたりの出力トークンの総数 - 1 分以内にすべてのリクエストに対して MU が生成できる出力トークンの数。

モデルユニットクォータは、プロビジョンドスループットに指定するコミットメントのレベルによって異なります。

  • コミットメントのないカスタムモデルの場合、プロビジョンドスループットあたりで利用できるクォータは 1 つのモデルユニットとなります。アカウントごとに最大 2 つのプロビジョンドスループットを作成できます。

  • コミットメントのある基盤モデルまたはカスタムモデルの場合、デフォルトのクォータは 0 モデルユニットです。モデルユニット数の引き上げをリクエストするには、サービスクォータの引き上げフォームを使用します。