Amazon Bedrock のクォータ

AWS アカウントには、Amazon Bedrock の制限と呼ばれるデフォルトのクォータがあります。Amazon Bedrock のサービスクォータを表示するには、次のいずれかを実行します。

「サービスクォータの表示」のステップに従って、サービスとして [Amazon Bedrock] を選択します。
「 AWS 全般のリファレンス」の「Amazon Bedrock サービスクォータ」を参照してください。

Amazon Bedrock のモデル推論は、トークン使用率のクォータによって制御されます。一部のモデルでは、トークンをより高いレートで使用します。これらの使用率とトークンの使用状況を最適化する方法の詳細については、「Amazon Bedrock でのトークンのカウント方法」を参照してください。

Amazon Bedrock には、モデルごとの独自のクォータ割り当てを持つ bedrock-runtimeと bedrock-mantle の 2 つの推論エンドポイントがあります。2 つのエンドポイントへのトラフィックは、同じ基盤となるモデルを呼び出す場合でも、個別のクォータに対して追跡されます。詳細については、「bedrock-runtime エンドポイントのクォータ」および「bedrock-mantle エンドポイントのクォータ」を参照してください。

サービスのパフォーマンスを維持し、Amazon Bedrock を適切に使用するために、アカウントに割り当てられたデフォルトのクォータは、リージョンの要因、支払い履歴、不正使用、および/またはクォータ引き上げリクエストの承認に応じて更新される場合があります。

トピック

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

コードの例

トークンのカウント