翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
プロビジョンドスループット
モデルにプロビジョンドスループットを設定すると、一定レベルのスループットが固定コストで得られます。
プロビジョンドスループットは、Amazon やサードパーティーのベースモデル、およびカスタマイズモデルで使用できます。
プロビジョンドスループットの料金は、使用するモデルと選択するコミットメント (契約) のレベルによって異なります。より長い期間にわたって契約すると、割引料金が適用されます。各モデルの料金の詳細については、Amazon Bedrock コンソールの「モデルプロバイダー
モデルのスループットのオプションは、推論をベースモデルで実行するか、カスタムモデルで実行するかによって異なります。
注記
AWS GovCloud (US) リージョンでは、コミットメントなしでカスタムモデルのプロビジョンドスループットのみを購入できます。
| 料金オプション | ベースモデル | カスタムモデル |
|---|---|---|
| プロビジョンドスループット、コミットメントなし (時間単位の料金) | 利用不可 | 利用可能 (アカウントあたり最大 2 つのプロビジョンドスループット) |
| プロビジョンドスループット、1 か月間のコミットメント | 利用可能 | 利用可能 |
| プロビジョンドスループット、6 か月間のコミットメント | 利用可能 | 利用可能 |
プロビジョンドスループットはモデルユニット (MU) 数で指定します。モデルユニットは、指定されたモデルに対する特定のスループットレベルを提供します。特定のテキストモデルに対する MU のスループットレベルでは、以下を指定します。
1 分あたりの入力トークンの総数 - 1 分以内にすべてのリクエストに対して MU が処理できる入力トークンの数。
1 分あたりの出力トークンの総数 - 1 分以内にすべてのリクエストに対して MU が生成できる出力トークンの数。
モデルユニットクォータは、プロビジョンドスループットに指定するコミットメントのレベルによって異なります。
-
コミットメントのないカスタムモデルの場合、プロビジョンドスループットあたりで利用できるクォータは 1 つのモデルユニットとなります。アカウントごとに最大 2 つのプロビジョンドスループットを作成できます。
-
コミットメントのある基盤モデルまたはカスタムモデルの場合、デフォルトのクォータは 0 モデルユニットです。モデルユニット数の引き上げをリクエストするには、サービスクォータの引き上げ
フォームを使用します。