Amazon Bedrock エンドポイントとクォータ
AWS サービスにプログラムで接続するには、エンドポイントを使用します。AWS サービスには、サービスがサポートする一部またはすべての AWS リージョンに、IPv4 エンドポイント、デュアルスタックエンドポイント、および FIPS エンドポイントのエンドポイントタイプが用意されています。一部のサービスにはグローバルエンドポイントが用意されています。詳細については、「AWS サービスエンドポイント」を参照してください。
サービスクォータ (制限とも呼ばれます) は、AWS アカウントのサービスリソースまたはオペレーションの最大数です。詳細については、「AWS サービスクォータ」を参照してください。
このサービスのサービスエンドポイントおよび Service Quotas を以下に示します。
Amazon Bedrock サービスエンドポイント
Amazon Bedrock コントロールプレーン API
次の表は、Amazon Bedrock でモデルの管理、トレーニング、およびデプロイがサポートされている、リージョン固有のエンドポイントの一覧です。Amazon Bedrock API オペレーションには、これらのエンドポイントを使用します。
| リージョン名 | リージョン | エンドポイント | プロトコル |
|---|---|---|---|
| 米国東部 (オハイオ) | us-east-2 |
bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
| 米国東部 (バージニア北部) | us-east-1 |
bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
| 米国西部 (北カリフォルニア) | us-west-1 |
bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com |
HTTPS HTTPS |
| 米国西部 (オレゴン) | us-west-2 |
bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
| アジアパシフィック (ハイデラバード) | ap-south-2 | bedrock.ap-south-2.amazonaws.com | HTTPS |
| アジアパシフィック (ジャカルタ) | ap-southeast-3 | bedrock.ap-southeast-3.amazonaws.com | HTTPS |
| アジアパシフィック (マレーシア) | ap-southeast-5 | bedrock.ap-southeast-5.amazonaws.com | HTTPS |
| アジアパシフィック (メルボルン) | ap-southeast-4 | bedrock.ap-southeast-4.amazonaws.com | HTTPS |
| アジアパシフィック (ムンバイ) | ap-south-1 | bedrock.ap-south-1.amazonaws.com | HTTPS |
| アジアパシフィック (大阪) | ap-northeast-3 | bedrock.ap-northeast-3.amazonaws.com | HTTPS |
| アジアパシフィック (ソウル) | ap-northeast-2 | bedrock.ap-northeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (シンガポール) | ap-southeast-1 | bedrock.ap-southeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (シドニー) | ap-southeast-2 | bedrock.ap-southeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (台北) | ap-east-2 | bedrock.ap-east-2.amazonaws.com | HTTPS |
| アジアパシフィック (タイ) | ap-southeast-7 | bedrock.ap-southeast-7.amazonaws.com | HTTPS |
| アジアパシフィック (東京) | ap-northeast-1 | bedrock.ap-northeast-1.amazonaws.com | HTTPS |
| カナダ (中部) | ca-central-1 |
bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
| 欧州 (フランクフルト) | eu-central-1 | bedrock.eu-central-1.amazonaws.com | HTTPS |
| 欧州 (アイルランド) | eu-west-1 | bedrock.eu-west-1.amazonaws.com | HTTPS |
| 欧州 (ロンドン) | eu-west-2 | bedrock.eu-west-2.amazonaws.com | HTTPS |
| ヨーロッパ (ミラノ) | eu-south-1 | bedrock.eu-south-1.amazonaws.com | HTTPS |
| 欧州 (パリ) | eu-west-3 | bedrock.eu-west-3.amazonaws.com | HTTPS |
| 欧州 (スペイン) | eu-south-2 | bedrock.eu-south-2.amazonaws.com | HTTPS |
| 欧州 (ストックホルム) | eu-north-1 | bedrock.eu-north-1.amazonaws.com | HTTPS |
| 欧州 (チューリッヒ) | eu-central-2 | bedrock.eu-central-2.amazonaws.com | HTTPS |
| イスラエル (テルアビブ) | il-central-1 | bedrock.il-central-1.amazonaws.com | HTTPS |
| 中東 (アラブ首長国連邦) | me-central-1 | bedrock.me-central-1.amazonaws.com | HTTPS |
| 南米 (サンパウロ) | sa-east-1 | bedrock.sa-east-1.amazonaws.com | HTTPS |
| AWS GovCloud (米国東部) | us-gov-east-1 |
bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
| AWS GovCloud (米国西部) | us-gov-west-1 |
bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Amazon Bedrock ランタイム API
次の表は、Amazon Bedrock でホストされるモデルに対して推論リクエストを行うために Amazon Bedrock でサポートされているリージョン固有のエンドポイントの一覧です。Amazon Bedrock ランタイム API オペレーションには、これらのエンドポイントを使用します。
| リージョン名 | リージョン | エンドポイント | プロトコル |
|---|---|---|---|
| 米国東部 (オハイオ) | us-east-2 |
bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
| 米国東部 (バージニア北部) | us-east-1 |
bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
| 米国西部 (オレゴン) | us-west-2 |
bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
| アジアパシフィック (ハイデラバード) | ap-south-2 | bedrock-runtime.ap-south-2.amazonaws.com | HTTPS |
| アジアパシフィック (ムンバイ) | ap-south-1 | bedrock-runtime.ap-south-1.amazonaws.com | HTTPS |
| アジアパシフィック (大阪) | ap-northeast-3 | bedrock-runtime.ap-northeast-3.amazonaws.com | HTTPS |
| アジアパシフィック (ソウル) | ap-northeast-2 | bedrock-runtime.ap-northeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (シンガポール) | ap-southeast-1 | bedrock-runtime.ap-southeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (シドニー) | ap-southeast-2 | bedrock-runtime.ap-southeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (東京) | ap-northeast-1 | bedrock-runtime.ap-northeast-1.amazonaws.com | HTTPS |
| カナダ (中部) | ca-central-1 |
bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
| 欧州 (フランクフルト) | eu-central-1 | bedrock-runtime.eu-central-1.amazonaws.com | HTTPS |
| 欧州 (アイルランド) | eu-west-1 | bedrock-runtime.eu-west-1.amazonaws.com | HTTPS |
| 欧州 (ロンドン) | eu-west-2 | bedrock-runtime.eu-west-2.amazonaws.com | HTTPS |
| ヨーロッパ (ミラノ) | eu-south-1 | bedrock-runtime.eu-south-1.amazonaws.com | HTTPS |
| 欧州 (パリ) | eu-west-3 | bedrock-runtime.eu-west-3.amazonaws.com | HTTPS |
| 欧州 (スペイン) | eu-south-2 | bedrock-runtime.eu-south-2.amazonaws.com | HTTPS |
| 欧州 (ストックホルム) | eu-north-1 | bedrock-runtime.eu-north-1.amazonaws.com | HTTPS |
| 欧州 (チューリッヒ) | eu-central-2 | bedrock-runtime.eu-central-2.amazonaws.com | HTTPS |
| 南米 (サンパウロ) | sa-east-1 | bedrock-runtime.sa-east-1.amazonaws.com | HTTPS |
| AWS GovCloud (米国東部) | us-gov-east-1 |
bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
| AWS GovCloud (米国西部) | us-gov-west-1 |
bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Agents for Amazon Bedrock ビルドタイム API
次の表は、エージェントとナレッジベースの作成と管理のために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。Amazon Bedrock エージェント API オペレーションには、これらのエンドポイントを使用します。
| リージョン名 | リージョン | エンドポイント | プロトコル |
|---|---|---|---|
| 米国東部 (バージニア北部) | us-east-1 | bedrock-agent.us-east-1.amazonaws.com | HTTPS |
| bedrock-agent-fips.us-east-1.amazonaws.com | HTTPS | ||
| 米国西部 (オレゴン) | us-west-2 | bedrock-agent.us-west-2.amazonaws.com | HTTPS |
| bedrock-agent-fips.us-west-2.amazonaws.com | HTTPS | ||
| アジアパシフィック (シンガポール) | ap-southeast-1 | bedrock-agent.ap-southeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (シドニー) | ap-southeast-2 | bedrock-agent.ap-southeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (東京) | ap-northeast-1 | bedrock-agent.ap-northeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (ソウル) | ap-northeast-2 | bedrock-agent.ap-northeast-2.amazonaws.com | HTTPS |
| カナダ (中部) | ca-central-1 | bedrock-agent.ca-central-1.amazonaws.com | HTTPS |
| 欧州 (フランクフルト) | eu-central-1 | bedrock-agent.eu-central-1.amazonaws.com | HTTPS |
| 欧州 (アイルランド) | eu-west-1 | bedrock-agent.eu-west-1.amazonaws.com | HTTPS |
| 欧州 (ロンドン) | eu-west-2 | bedrock-agent.eu-west-2.amazonaws.com | HTTPS |
| 欧州 (パリ) | eu-west-3 | bedrock-agent.eu-west-3.amazonaws.com | HTTPS |
| アジアパシフィック (ムンバイ) | ap-south-1 | bedrock-agent.ap-south-1.amazonaws.com | HTTPS |
| 南米 (サンパウロ) | sa-east-1 | bedrock-agent.sa-east-1.amazonaws.com | HTTPS |
Agents for Amazon Bedrock ランタイム API
次の表は、エージェントの呼び出しとナレッジベースのクエリのために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。Amazon Bedrock エージェントのランタイム API オペレーションには、これらのエンドポイントを使用します。
| リージョン名 | リージョン | エンドポイント | プロトコル |
|---|---|---|---|
| 米国東部 (バージニア北部) | us-east-1 | bedrock-agent-runtime.us-east-1.amazonaws.com | HTTPS |
| bedrock-agent-runtime-fips.us-east-1.amazonaws.com | HTTPS | ||
| 米国西部 (オレゴン) | us-west-2 | bedrock-agent-runtime.us-west-2.amazonaws.com | HTTPS |
| bedrock-agent-runtime-fips.us-west-2.amazonaws.com | HTTPS | ||
| アジアパシフィック (シンガポール) | ap-southeast-1 | bedrock-agent-runtime.ap-southeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (シドニー) | ap-southeast-2 | bedrock-agent-runtime.ap-southeast-2.amazonaws.com | HTTPS |
| アジアパシフィック (東京) | ap-northeast-1 | bedrock-agent-runtime.ap-northeast-1.amazonaws.com | HTTPS |
| アジアパシフィック (ソウル) | ap-northeast-2 | bedrock-agent-runtime.ap-northeast-2.amazonaws.com | HTTPS |
| カナダ (中部) | ca-central-1 | bedrock-agent-runtime.ca-central-1.amazonaws.com | HTTPS |
| 欧州 (フランクフルト) | eu-central-1 | bedrock-agent-runtime.eu-central-1.amazonaws.com | HTTPS |
| 欧州 (パリ) | eu-west-3 | bedrock-agent-runtime.eu-west-3.amazonaws.com | HTTPS |
| 欧州 (アイルランド) | eu-west-1 | bedrock-agent-runtime.eu-west-1.amazonaws.com | HTTPS |
| 欧州 (ロンドン) | eu-west-2 | bedrock-agent-runtime.eu-west-2.amazonaws.com | HTTPS |
| アジアパシフィック (ムンバイ) | ap-south-1 | bedrock-agent-runtime.ap-south-1.amazonaws.com | HTTPS |
| 南米 (サンパウロ) | sa-east-1 | bedrock-agent-runtime.sa-east-1.amazonaws.com | HTTPS |
Amazon Bedrock Data Automation API
次の表は、Amazon Bedrock Data Automation でサポートされているリージョン固有のエンドポイントの一覧です。runtime という単語を使用するエンドポイントは、ブループリントとプロジェクトを呼び出し、ファイルから情報を抽出します。Amazon Bedrock Data Automation ランタイム API オペレーションには、これらのエンドポイントを使用します。runtime を使用しないエンドポイントはブループリントとプロジェクトの作成に使用され、抽出に関するガイダンスを提供します。Amazon Bedrock Data Automation API Buildtime オペレーションには、これらのエンドポイントを使用します。
| リージョン名 | リージョン | エンドポイント | プロトコル |
|---|---|---|---|
| 米国東部 (バージニア北部) | us-east-1 |
bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws |
HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS |
| 米国西部 (オレゴン) | us-west-2 |
bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws |
HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS |
| アジアパシフィック (ムンバイ) | ap-south-1 |
bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com |
HTTPS HTTPS |
| アジアパシフィック (シドニー) | ap-southeast-2 |
bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com |
HTTPS HTTPS |
| 欧州 (フランクフルト) | eu-central-1 |
bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com |
HTTPS HTTPS |
| 欧州 (アイルランド) | eu-west-1 |
bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com |
HTTPS HTTPS |
| 欧州 (ロンドン) | eu-west-2 |
bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com |
HTTPS HTTPS |
| AWS GovCloud (米国西部) | us-gov-west-1 |
bedrock-data-automation.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com bedrock-data-automation-fips.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS HTTPS HTTPS |
Amazon Bedrock サービスクォータ
ヒント
Amazon Bedrock には多数のクォータがあるため、サービスクォータの表示には以下の表ではなくコンソールを使用することをお勧めします。Amazon Bedrock クォータ
| 名前 | デフォルト | 引き上げ可能 | 説明 |
|---|---|---|---|
| (高度なプロンプト最適化) アカウントあたりのアクティブなジョブ | サポートされている各リージョン: 20 | なし | アカウントあたりのアクティブな高度なプロンプト最適化 (APO) ジョブの最大数。 |
| (高度なプロンプト最適化) アカウントあたりの非アクティブなジョブ | サポートされている各リージョン: 5,000 | なし | アカウントあたりの非アクティブな高度なプロンプト最適化 (APO) ジョブの最大数。 |
| (自動推論) ポリシーの注釈 | サポートされている各リージョン: 10 | なし | 自動推論ポリシーの注釈の最大数。 |
| (自動推論) 1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 |
| (自動推論) ポリシーあたりの同時ビルド数 | サポートされている各リージョン: 2 | なし | 自動推論ポリシーあたりの同時ビルドの最大数。 |
| (自動推論) アカウントあたりの同時ポリシービルド数 | サポートされている各リージョン:5 | なし | 1 つのアカウントでの同時自動推論ポリシービルドの最大数。 |
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの CreateAutomatedReasoningPolicy API リクエストの最大数。 |
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの CreateAutomatedReasoningPolicyTestCase API リクエストの最大数。 |
| (自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyVersion リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの CreateAutomatedReasoningPolicyVersion API リクエストの最大数。 |
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの DeleteAutomatedReasoningPolicy API リクエストの最大数。 |
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 |
| (自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの DeleteAutomatedReasoningPolicyTestCase API リクエストの最大数。 |
| (自動推論) 1 秒あたりの ExportAutomatedReasoningPolicyVersion リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの ExportAutomatedReasoningPolicyVersion API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicy API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyAnnotations リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyAnnotations API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyNextScenario リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyNextScenario API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyTestCase API リクエストの最大数。 |
| (自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestResult リクエスト数 | サポートされている各リージョン: 10 | あり |
1 秒あたりの GetAutomatedReasoningPolicyTestResult API リクエストの最大数。 |
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicies リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの ListAutomatedReasoningPolicies API リクエストの最大数。 |
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows API リクエストの最大数。 |
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestCases リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの ListAutomatedReasoningPolicyTestCases API リクエストの最大数。 |
| (自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestResults リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの ListAutomatedReasoningPolicyTestResults API リクエストの最大数。 |
| (自動推論) アカウントごとのポリシー | サポートされている各リージョン: 100 | なし | 1 つのアカウント内の自動推論ポリシーの最大数。 |
| (自動推論) ポリシーのルール | サポートされている各リージョン: 500 | なし | 自動推論ポリシーのルールの最大数。 |
| (自動推論) ソースドキュメントサイズ (MB) | サポートされている各リージョン:5 | なし | 自動推論ポリシーを作成するためのソースドキュメントの最大サイズ (MB)。 |
| (自動推論) ソースドキュメントトークン | サポートされている各リージョン: 122,880 | なし | 自動推論ポリシーの作成時にソースドキュメントで許可されるトークンの最大数。 |
| (自動推論) 1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow リクエスト数 | サポートされている各リージョン: 1 | あり |
1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。 |
| (自動推論) 1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow リクエスト数 | サポートされている各リージョン: 1 | あり |
1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow API リクエストの最大数。 |
| (自動推論) ポリシーごとのテスト | サポートされている各リージョン: 100 | なし | 自動推論ポリシーごとのテストの最大数。 |
| (自動推論) ポリシーごとのタイプ | サポートされている各リージョン: 50 | なし | 自動推論ポリシーごとのタイプの最大数。 |
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicy リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの UpdateAutomatedReasoningPolicy API リクエストの最大数。 |
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations API リクエストの最大数。 |
| (自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyTestCase リクエスト数 | サポートされている各リージョン: 5 | あり |
1 秒あたりの UpdateAutomatedReasoningPolicyTestCase API リクエストの最大数。 |
| (自動推論) ポリシーのタイプごとの値 | サポートされている各リージョン: 50 | なし | 自動推論ポリシーのタイプごとの値の最大数。 |
| (自動推論) ポリシーの変数 | サポートされている各リージョン: 200 | なし | 自動推論ポリシー内の変数の最大数。 |
| (自動推論) ポリシーごとのバージョン | サポートされている各リージョン: 1,000 | なし | 自動推論ポリシーごとのバージョンの最大数。 |
| (データ自動化) (コンソール) ドキュメントの最大ファイルサイズ (MB) | サポートされている各リージョン: 200 | なし | コンソールの最大ファイルサイズ |
| (データ自動化) (コンソール) ドキュメントファイルあたりの最大ページ数 | サポートされている各リージョン: 20 | なし | コンソールのドキュメントあたりの最大ページ数 |
| (データ自動化) CreateBlueprint – アカウントあたりのブループリントの最大数 | サポートされている各リージョン: 350 | あり |
アカウントあたりのブループリントの最大数 |
| (データ自動化) CreateBlueprintVersion – ブループリントごとのブループリントバージョンの最大数 | サポートされている各リージョン: 10 | あり |
ブループリントあたりのバージョンの最大数 |
| (データ自動化) フィールドの説明の長さ (文字) | サポートされている各リージョン: 300 | なし | フィールドの説明の最大文字数 |
| (データ自動化) InvokeDataAutomationAsync – 音声 – 同時ジョブの最大数 |
us-east-1: 20 us-west-2: 20 他のサポートされている各リージョン: 2 |
あり |
音声用のデータ自動化の非同期呼び出しのオープンジョブの最大数 |
| (データ自動化) InvokeDataAutomationAsync – ドキュメント – 同時ジョブの最大数 |
us-east-1: 25 us-west-2: 25 他のサポートされている各リージョン: 5 |
あり |
ドキュメント用のデータ自動化の非同期呼び出しのオープンジョブの最大数 |
| (データ自動化) InvokeDataAutomationAsync – 画像 – 同時ジョブの最大数 |
us-east-1: 20 us-west-2: 20 他のサポートされている各リージョン: 5 |
あり |
画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数 |
| (データ自動化) InvokeDataAutomationAsync – オープンジョブの最大数 | サポートされている各リージョン: 1,800 | なし | 画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数 |
| (データ自動化) InvokeDataAutomationAsync – 動画 – 同時ジョブの最大数 |
us-east-1: 20 us-west-2: 20 他のサポートされている各リージョン: 3 |
あり |
動画用のデータ自動化の非同期呼び出しのオープンジョブの最大数 |
| (データ自動化) InvokeEntityIngestionAsync – 人物 – トークンの最大数 | サポートされている各リージョン: 600 | あり |
人物エンティティ取り込みのトークンの最大数 |
| (データ自動化) 音声の最大サンプルレート (Hz) | サポートされている各リージョン: 48,000 | なし | 音声の最大サンプルレート |
| (データ自動化) プロジェクトあたりのブループリントの最大数 (音声) | サポートされている各リージョン: 1 | [いいえ] | 音声のプロジェクトあたりのブループリントの最大数 |
| (データ自動化) プロジェクトあたりのブループリントの最大数 (ドキュメント) | サポートされている各リージョン: 40 | なし | ドキュメントのプロジェクトあたりのブループリントの最大数 |
| (データ自動化) プロジェクトあたりのブループリントの最大数 (画像) | サポートされている各リージョン: 1 | [いいえ] | 画像のプロジェクトあたりのブループリントの最大数 |
| (データ自動化) プロジェクトあたりのブループリントの最大数 (動画) | サポートされている各リージョン: 1 | [いいえ] | 動画のプロジェクトあたりのブループリントの最大数 |
| (データ自動化) JSON ブループリントの最大サイズ (文字) | サポートされている各リージョン: 100,000 | なし | 文字単位の JSON の最大サイズ |
| (データ自動化) フィールド階層の最大レベル | サポートされている各リージョン: 1 | [いいえ] | フィールド階層の最大数レベル |
| (データ自動化) ドキュメントあたりの最大ページ数 | サポートされている各リージョン: 3,000 | なし | ドキュメントあたりの最大ページ数 |
| (データ自動化) 最大解像度 | サポートされている各リージョン: 8,000 | なし | 画像の最大解像度 |
| (データ自動化) 音声ファイルの最大サイズ (MB) | サポートされている各リージョン: 2,048 | なし | 音声の最大ファイルサイズ |
| (データ自動化) 音声の最大長 (分) | サポートされている各リージョン: 240 | なし | 分単位の音声の最大長 |
| (データ自動化) ドキュメントファイルの最大サイズ (MB) | サポートされている各リージョン: 500 | なし | ファイルの最大サイズ |
| (データ自動化) 画像ファイルの最大サイズ (MB) | サポートされている各リージョン:5 | なし | 画像の最大ファイルサイズ |
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (音声) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 |
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (ドキュメント) | サポートされている各リージョン: 10 | なし | 推論開始リクエストのインラインブループリントの最大数 |
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (画像) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 |
| (データ自動化) 推論開始リクエストあたりのブループリントの最大数 (動画) | サポートされている各リージョン: 1 | [いいえ] | 推論開始リクエストのインラインブループリントの最大数 |
| (データ自動化) ブループリントあたりのリストフィールドの最大数 | サポートされている各リージョン: 15 | なし | ブループリントあたりのリストフィールドの最大数 |
| (データ自動化) 動画ファイルの最大サイズ (MB) | サポートされている各リージョン: 10,240 | なし | 動画の最大ファイルサイズ |
| (データ自動化) 動画の最大長 (分) | サポートされている各リージョン: 240 | なし | 分単位の動画の最大長 |
| (データ自動化) 音声の最小サンプルレート (Hz) | サポートされている各リージョン: 8,000 | なし | 音声の最小サンプルレート |
| (データ自動化) 音声の最小長 (ミリ秒) | サポートされている各リージョン: 500 | なし | ミリ秒単位の音声の最小長 |
| (評価) 同時自動モデル評価ジョブの数 | サポートされている各リージョン: 20 | なし | このアカウントで現在のリージョンに一度に指定できる自動モデル評価ジョブの最大数。 |
| (評価) ヒューマンワーカーを使用する同時モデル評価ジョブの数 | サポートされている各リージョン: 10 | なし | このアカウントで現在のリージョンに一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。 |
| (評価) カスタムメトリクスの数 | サポートされている各リージョン: 10 | なし | ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。 |
| (評価) 人間ベースのモデル評価ジョブのカスタムプロンプトデータセットの数 | サポートされている各リージョン: 1 | [いいえ] | このアカウントで現在のリージョンに人間ベースのモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。 |
| (評価) ジョブあたりのデータセットの数 | サポートされている各リージョン:5 | なし | 自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。 |
| (評価) 評価ジョブの数 | サポートされている各リージョン: 5,000 | なし | このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。 |
| (評価) データセットあたりのメトリクスの数 | サポートされている各リージョン: 3 | なし | 自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。 |
| (評価) ヒューマンワーカーを使用するモデル評価ジョブのモデルの数 | サポートされている各リージョン: 2 | なし | ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。 |
| (評価) 自動モデル評価ジョブのモデル数 | サポートされている各リージョン: 1 | [いいえ] | 自動モデル評価ジョブで指定できるモデルの最大数。 |
| (評価) カスタムプロンプトデータセットのプロンプトの数 | サポートされている各リージョン: 1,000 | なし | カスタムプロンプトデータセットに含めることができるプロンプトの最大数。 |
| (評価) プロンプトのサイズ | サポートされている各リージョン: 4 | なし | カスタムプロンプトデータセットの個々のプロンプトの最大サイズ (KB)。 |
| (評価) ワーカーのタスク時間 | サポートされている各リージョン: 30 | なし | ワーカーがタスクを完了するために使える最長時間 (日数)。 |
| (フロー) フローあたりのエージェントノード数 | サポートされている各リージョン: 20 | なし | エージェントノードの最大数。 |
| (フロー) フローあたりのコレクターノード | サポートされている各リージョン: 1 | [いいえ] | コレクターノードの最大数。 |
| (フロー) フローあたりの条件ノード | サポートされている各リージョン:5 | なし | 条件ノードの最大数。 |
| (フロー) 条件ノードあたりの条件 | サポートされている各リージョン:5 | なし | 条件ノードあたりの条件の最大数。 |
| (フロー) 1 秒あたりの CreateFlow リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateFlow リクエストの最大数。 |
| (フロー) 1 秒あたりの CreateFlowAlias リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateFlowAlias リクエストの最大数。 |
| (フロー) 1 秒あたりの CreateFlowVersion リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateFlowVersion リクエストの最大数。 |
| (フロー) 1 秒あたりの DeleteFlow リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeleteFlow リクエストの最大数。 |
| (フロー) 1 秒あたりの DeleteFlowAlias リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeleteFlowAlias リクエストの最大数。 |
| (フロー) 1 秒あたりの DeleteFlowVersion リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeleteFlowVersion リクエストの最大数。 |
| (フロー) フローあたりのフローエイリアス | サポートされている各リージョン: 10 | なし | フローエイリアスの最大数。 |
| (フロー) アカウントあたりのフロー実行数 | サポートされている各リージョン: 1,000 | あり |
フロー実行のアカウントあたりの最大数。 |
| (フロー) フローあたりのフローバージョン | サポートされている各リージョン: 10 | なし | フローバージョンの最大数。 |
| (フロー) アカウントあたりのフロー | サポートされている各リージョン: 100 | 可能 |
フローのアカウントあたりの最大数 |
| (フロー) 1 秒あたりの GetFlow リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetFlow リクエストの最大数。 |
| (フロー) 1 秒あたりの GetFlowAlias リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetFlowAlias リクエストの最大数。 |
| (フロー) 1 秒あたりの GetFlowVersion リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetFlowVersion リクエストの最大数。 |
| (フロー) フローあたりのインラインコードノード数 | サポートされている各リージョン:5 | なし | フローあたりのインラインコードノードの最大数。 |
| (フロー) フローあたりの入力ノード数 | サポートされている各リージョン: 1 | [いいえ] | フロー入力ノードの最大数。 |
| (フロー) フローあたりのイテレーターノード数 | サポートされている各リージョン: 1 | [いいえ] | イテレーターノードの最大数。 |
| (フロー) フローあたりのナレッジベースノード数 | サポートされている各リージョン: 20 | なし | ナレッジベースノードの最大数。 |
| (フロー) フローあたりの Lambda 関数ノード数 | サポートされている各リージョン: 20 | なし | Lambda 関数ノードの最大数。 |
| (フロー) フローあたりの Lex ノード数 | サポートされている各リージョン:5 | なし | Lex ノードの最大数。 |
| (フロー) 1 秒あたりの ListFlowAliases リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListFlowAliases リクエストの最大数。 |
| (フロー) 1 秒あたりの ListFlowVersions リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListFlowVersions リクエストの最大数。 |
| (フロー) 1 秒あたりの ListFlows リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListFlows リクエストの最大数。 |
| (フロー) フローあたりの出力ノード数 | サポートされている各リージョン: 20 | なし | フロー出力ノードの最大数。 |
| (フロー) 1 秒あたりの PrepareFlow リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの PrepareFlow リクエストの最大数。 |
| (フロー) フローあたりのプロンプトノード数 | サポートされている各リージョン: 20 | 可能 |
プロンプトノードの最大数。 |
| (フロー) フローあたりの S3 取得ノード数 | サポートされている各リージョン: 10 | なし | S3 取得ノードの最大数。 |
| (フロー) フローあたりの S3 ストレージノード数 | サポートされている各リージョン: 10 | なし | S3 ストレージノードの最大数。 |
| (フロー) フローあたりの合計ノード数 | サポートされている各リージョン: 40 | なし | フロー内のノードの最大数。 |
| (フロー) 1 秒あたりの UpdateFlow リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの UpdateFlow リクエストの最大数。 |
| (フロー) 1 秒あたりの UpdateFlowAlias リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの UpdateFlowAlias リクエストの最大数。 |
| (フロー) 1 秒あたりの ValidateFlowDefinition リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの ValidateFlowDefinition リクエストの最大数。 |
| (ガードレール) ガードレールあたりの自動推論ポリシー | サポートされている各リージョン: 2 | なし | ガードレールあたりの自動推論ポリシーの最大数。 |
| (ガードレール) テキスト単位のコンテキストグラウンディングクエリの長さ | サポートされている各リージョン: 1 | [いいえ] | テキスト単位のコンテキストグラウンディングクエリの最大長 |
| (ガードレール) テキスト単位のコンテキストグラウンディングレスポンスの長さ | サポートされている各リージョン:5 | なし | テキスト単位のコンテキストグラウンディングレスポンスの最大長 |
| (ガードレール) テキスト単位のコンテキストグラウンディングソースの長さ |
us-east-1: 100 us-west-2: 100 他のサポートされている各リージョン: 50 |
なし | テキスト単位のコンテキストグラウンディングのグラウンディングソースの最大長 |
| (ガードレール) トピックあたりのフレーズの例 | サポートされている各リージョン:5 | なし | トピックごとに含めることができるトピックの例の最大数 |
| (ガードレール) アカウントあたりのガードレール数 | サポートされている各リージョン: 100 | なし | アカウント内のガードレールの最大数 |
| (ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数 |
us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25 |
あり |
コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 |
| (ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数 (標準) |
us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25 |
あり |
コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは標準コンテンツポリシーモデルに適用されます。 |
| (ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数 |
us-east-1: 50 us-west-2: 50 他のサポートされている各リージョン: 25 |
あり |
拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数 |
| (ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数 (標準) |
us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25 |
あり |
拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは、標準トピックポリシーモデルに適用されます。 |
| (ガードレール) オンデマンド ApplyGuardrail 機密情報フィルターポリシーの 1 秒あたりのテキストユニット数 |
us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25 |
あり |
機密情報フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 |
| (ガードレール) オンデマンド ApplyGuardrail 単語フィルターポリシーの 1 秒あたりのテキストユニット数 |
us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25 |
あり |
単語フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数 |
| (ガードレール) オンデマンド ApplyGuardrail コンテキストグラウンディングポリシーの 1 秒あたりのテキストユニット数 | サポートされている各リージョン: 106 | あり |
コンテキストグラウンディングポリシーで処理できる 1 秒あたりのテキストユニットの最大数 |
| (ガードレール) 1 秒あたりのオンデマンド ApplyGuardrail リクエスト数 |
us-east-1: 50 us-west-2: 50 他のサポートされている各リージョン: 25 |
あり |
1 秒あたりに実行できる ApplyGuardrail API コールの最大数 |
| (ガードレール) 機密情報フィルターの正規表現エンティティ | サポートされている各リージョン: 10 | なし | 機密情報ポリシーに含めることができるガードレールフィルター正規表現の最大数 |
| (ガードレール) 正規表現の長さ (文字数) | サポートされている各リージョン: 500 | なし | ガードレールフィルター正規表現の最大文字数 |
| (ガードレール) ガードレールあたりのトピック | サポートされている各リージョン: 30 | なし | ガードレールトピックポリシー間で定義できるトピックの最大数 |
| (ガードレール) ガードレールあたりのバージョン | サポートされている各リージョン: 20 | なし | ガードレールで保持できるバージョンの最大数 |
| (ガードレール) 単語の長さ (文字数) | サポートされている各リージョン: 100 | なし | ブロックされた単語リスト内の単語の最大長 (文字数) |
| (ガードレール) 単語ポリシーあたりの単語数 | サポートされている各リージョン: 10,000 | なし | ブロックされる単語リストに含めることができる単語の最大数 |
| (ナレッジベース) アカウントあたりの IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの同時実行 | サポートされている各リージョン: 10 | なし | アカウントで同時に実行できる IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの最大数。 |
| (ナレッジベース) アカウントあたりの同時取り込みジョブ | サポートされている各リージョン:5 | なし | アカウントで同時に実行できる取り込みジョブの最大数。 |
| (ナレッジベース) データソースあたりの同時取り込みジョブ | サポートされている各リージョン: 1 | [いいえ] | データソースに対して同時に実行できる取り込みジョブの最大数。 |
| (ナレッジベース) ナレッジベースあたりの同時取り込みジョブ | サポートされている各リージョン: 1 | [いいえ] | ナレッジベースに対して同時に実行できる取り込みジョブの最大数。 |
| (ナレッジベース) 1 秒あたりの CreateDataSource リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateDataSource API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの CreateKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateKnowledgeBase API リクエストの最大数。 |
| (ナレッジベース) ナレッジベースあたりのデータソース | サポートされている各リージョン:5 | なし | ナレッジベースあたりのデータソースの最大数。 |
| (ナレッジベース) 1 秒あたりの DeleteDataSource リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeleteDataSource API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの DeleteKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeleteKnowledgeBase API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの DeleteKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン:5 | なし | 1 秒あたりの DeleteKnowledgeBaseDocuments API リクエストの最大数。 |
| (ナレッジベース) 取り込みジョブごとに追加または更新するファイル | サポートされている各リージョン: 5,000,000 | なし | 取り込みジョブごとに取り込み可能な新規および更新されたファイルの最大数。 |
| (ナレッジベース) 取り込みジョブごとに削除するファイル | サポートされている各リージョン: 5,000,000 | なし | 取り込みジョブごとに削除できるファイルの最大数。 |
| (ナレッジベース) IngestKnowledgeBaseDocuments ジョブごとに取り込むファイル。 | サポートされている各リージョン: 25 | なし | IngestKnowledgeBaseDocuments リクエストごとに取り込み可能なドキュメントの最大数。 |
| (ナレッジベース) 1 秒あたりの GenerateQuery リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの GenerateQuery API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの GetDataSource リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetDataSource API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの GetIngestionJob リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetIngestionJob API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの GetKnowledgeBase リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetKnowledgeBase API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの GetKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン:5 | なし | 1 秒あたりの GetKnowledgeBaseDocuments API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの IngestKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン:5 | なし | 1 秒あたりの IngestKnowledgeBaseDocuments API リクエストの最大数。 |
| (ナレッジベース) IngestKnowledgeBaseDocuments の合計ペイロードサイズ | サポートされている各リージョン: 6 | なし | IngestKnowledgeBaseDocuments リクエストの合計ペイロードの最大サイズ (MB)。 |
| (ナレッジベース) 取り込みジョブのファイルサイズ | サポートされている各リージョン: 50 | なし | 取り込みジョブ内のファイルの最大サイズ (MB)。 |
| (ナレッジベース) 取り込みジョブのサイズ | サポートされている各リージョン: 100 | なし | 取り込みジョブの最大サイズ (GB)。 |
| (ナレッジベース) アカウントあたりのナレッジベース数 | サポートされている各リージョン: 100 | なし | アカウントあたりのナレッジベースの最大数。 |
| (ナレッジベース) 1 秒あたりの ListDataSources リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListDataSources API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの ListIngestionJobs リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListIngestionJobs API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの ListKnowledgeBaseDocuments リクエスト数 | サポートされている各リージョン:5 | なし | 1 秒あたりの ListKnowledgeBaseDocuments API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの ListKnowledgeBases リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListKnowledgeBases API リクエストの最大数。 |
| (ナレッジベース) BDA パーサーのファイルの最大数 | サポートされている各リージョン: 1,000 | なし | Amazon Bedrock Data Automation をパーサーとして使用できるファイルの最大数。 |
| (ナレッジベース) パーサーとしての基盤モデルのファイルの最大数 | サポートされている各リージョン: 1,000 | なし | 基盤モデルをパーサーとして使用できるファイルの最大数。 |
| (ナレッジベース) 1 秒あたりの Rerank リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの Rerank API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの Retrieve リクエスト数 | サポートされている各リージョン: 20 | なし | 1 秒あたりの Retrieve API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの RetrieveAndGenerate リクエスト数 | サポートされている各リージョン: 20 | なし | 1 秒あたりの RetrieveAndGenerate API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの RetrieveAndGenerateStream リクエスト数 | サポートされている各リージョン: 20 | なし | 1 秒あたりの RetrieveAndGenerateStream API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの StartIngestionJob リクエスト数 | サポートされている各リージョン: 0.1 | なし | 1 秒あたりの StartIngestionJob API リクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの UpdateDataSource リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの UpdateDataSource API のリクエストの最大数。 |
| (ナレッジベース) 1 秒あたりの UpdateKnowledgeBase リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの UpdateKnowledgeBase API リクエストの最大数。 |
| (ナレッジベース) ユーザークエリサイズ | サポートされている各リージョン: 1,000 | なし | ユーザークエリの最大サイズ (文字数)。 |
| (モデルのカスタマイズ) アカウントあたりのカスタムモデル | サポートされている各リージョン: 100 | 可能 |
アカウントのカスタムモデルの最大数。 |
| (モデルのカスタマイズ) 進行中のカスタムモデルのデプロイ | サポートされている各リージョン: 2 | あり |
進行中のカスタムモデルのデプロイの最大数 |
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大入力ファイルサイズ | サポートされている各リージョン: 2 GB | なし | カスタマイズ蒸留ジョブの最大入力ファイルサイズ。 |
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大行長 | サポートされている各リージョン: 16 キロバイト | なし | カスタマイズ蒸留ジョブの入力ファイルの最大行長。 |
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最大数 | サポートされている各リージョン: 15,000 | なし | カスタマイズ蒸留ジョブに必要なプロンプトの最大数。 |
| (モデルのカスタマイズ) Amazon Nova Canvas ファインチューニングジョブのトレーニングレコードの最大数 | サポートされている各リージョン: 10,000 | あり |
Amazon Nova Canvas ファインチューニングジョブで許可されるレコードの最大数。 |
| (モデルのカスタマイズ) Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | なし | Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 |
| (モデルのカスタマイズ) Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | なし | Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 |
| (モデルのカスタマイズ) Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | なし | Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 |
| (モデルのカスタマイズ) Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 16,000 | なし | Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 |
| (モデルのカスタマイズ) Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長 | サポートされている各リージョン: 32,000 | なし | Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。 |
| (モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最小数 | サポートされている各リージョン: 100 | なし | カスタマイズ蒸留ジョブに必要なプロンプトの最小数。 |
| (モデルのカスタマイズ) スケジュールされたカスタマイズジョブ | サポートされている各リージョン: 10 | なし | スケジュールされたカスタマイズジョブの最大数。 |
| (モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 2,000 | なし | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 |
| (モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 2,000 | なし | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 |
| (モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 200 | なし | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 |
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計 | サポートされている各リージョン: 400 | なし | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計 |
| (モデルのカスタマイズ) Amazon Nova Lite の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 5,760,000,000 | なし | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Micro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 5,760,000,000 | なし | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Pro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 1,152,000,000 | なし | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 432,000,000 | なし | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 4,000,000 | なし | Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 4,000,000 | なし | Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 800,000 | なし | Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計 |
| (モデルのカスタマイズ) Amazon Nova Lite ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 | あり |
Amazon Nova Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Amazon Nova Micro ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 | あり |
Amazon Nova Micro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Amazon Nova Pro ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Amazon Nova Pro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Claude 3 Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Claude 3 Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Claude 3-5-Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Claude 3-5-Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 2 13B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 2 13B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 2 70B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 2 70B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.1 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.1 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.1 8B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.1 8B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.2 11B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.2 11B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.2 1B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.2 1B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.2 3B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.2 3B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.2 90B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.2 90B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Meta Llama 3.3 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Meta Llama 3.3 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Image Generator G1 V1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Titan Image Generator ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Image Generator G1 V2 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Titan Image Generator V2 ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Multimodal Embeddings G1 v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン:50,000 | あり |
Titan Multimodal Embeddings ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Text G1 – Express v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 100,000 | あり |
Titan Text Express の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Text G1 – Express v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Titan Text Express ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Text G1 – Lite v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 100,000 | あり |
Titan Text Lite の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Text G1 – Lite v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 10,000 | あり |
Titan Text Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) Titan Text G1 – Premier v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計 | サポートされている各リージョン: 20,000 | あり |
Titan Text Premier ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。 |
| (モデルのカスタマイズ) カスタムモデルのデプロイの合計数 | サポートされている各リージョン: 10 | あり |
カスタムモデルのデプロイの合計数 |
| (プロンプト管理) 1 秒あたりの CreatePrompt リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreatePrompt リクエストの最大数。 |
| (プロンプト管理) 1 秒あたりの CreatePromptVersion リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreatePromptVersion リクエストの最大数。 |
| (プロンプト管理) 1 秒あたりの DeletePrompt リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの DeletePrompt リクエストの最大数。 |
| (プロンプト管理) 1 秒あたりの GetPrompt リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの GetPrompt リクエストの最大数。 |
| (プロンプト管理) 1 秒あたりの ListPrompts リクエスト数 | サポートされている各リージョン: 10 | なし | 1 秒あたりの ListPrompts リクエストの最大数。 |
| (プロンプト管理) アカウントあたりのプロンプト | サポートされている各リージョン:500 | あり |
プロンプトの最大数。 |
| (プロンプト管理) 1 秒あたりの UpdatePrompt リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの UpdatePrompt リクエストの最大数。 |
| (プロンプト管理) プロンプトあたりのバージョン | サポートされている各リージョン: 10 | なし | プロンプトあたりのバージョンの最大数。 |
| エージェントあたりの API | サポートされている各リージョン: 11 | あり |
エージェントに追加できる API の最大数。 |
| エージェントあたりのアクショングループ | サポートされている各リージョン: 20 | 可能 |
エージェントに追加できるアクショングループの最大数。 |
| エージェントあたりのエージェントコラボレーター | サポートされている各リージョン: 1,000 | あり |
エージェントに追加できるコラボレーターエージェントの最大数。 |
| アカウントあたりのエージェント | サポートされている各リージョン: 1,000 | あり |
1 つのアカウントのエージェントの最大数。 |
| 1 秒あたりの AssociateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 6 | なし | 1 秒あたりの AssociateAgentKnowledgeBase API リクエストの最大数。 |
| エージェントあたりの関連付けられたエイリアス | サポートされている各リージョン: 10 | なし | エージェントに関連付けられるエイリアスの最大数。 |
| エージェントあたりの関連付けられたナレッジベース | サポートされている各リージョン: 2 | あり |
エージェントに関連付けられるナレッジベースの最大数。 |
| Amazon Nova Premier のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Amazon Nova Premier のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3 Haiku のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3 Opus のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Opus のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3.5 Haiku のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3.5 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3.5 Sonnet v2 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Claude 3.5 Sonnet v2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude 3.7 Sonnet のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | あり |
Claude 3.7 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Claude Sonnet 4 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | あり |
Claude Sonnet 4 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.1 405B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 405B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.1 70B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.1 8B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.1 8B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.2 11B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 11B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.2 1B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 1B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.2 3B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 3B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.2 90B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.2 90B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 3.3 70B Instruct のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 3.3 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 4 Maverick のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 4 Maverick のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Llama 4 Scout のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Llama 4 Scout のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Mistral Large 2 (24.07) のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Mistral Large 2 (24.07) のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 |
| Mistral Small のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Mistral Small のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 |
| Nova Lite V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Lite V1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 |
| Nova Micro V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Micro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Nova Pro V1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Nova Pro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| OpenAI GPT OSS 120b のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS 120b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| OpenAI GPT OSS 20b のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | OpenAI GPT OSS 20b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Titan Multimodal Embeddings G1 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Titan Multimodal Embeddings G1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。 |
| DeepSeek v3 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | DeepSeek v3 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Qwen3 235B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 235B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Qwen3 32B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 32B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Qwen3 Coder 30B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Coder 30B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Qwen3 Coder 480B のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Qwen3 Coder 480B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Titan Text Embeddings V2 のバッチ推論入力ファイルサイズ (GB) | サポートされている各リージョン: 1 | [いいえ] | Titan Text Embeddings V2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。 |
| Amazon Nova Premier のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Amazon Nova Premier のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3 Haiku のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3 Opus のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3 Opus のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3.5 Haiku のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3.5 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3.5 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3.5 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3.5 Sonnet v2 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Claude 3.5 Sonnet v2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude 3.7 Sonnet のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン: 5 | あり |
Claude 3.7 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Claude Sonnet 4 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン: 5 | あり |
Claude Sonnet 4 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.1 405B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.1 405B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.1 70B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.1 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.1 8B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.1 8B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.2 11B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.2 11B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.2 1B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.2 1B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.2 3B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.2 3B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.2 90B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.2 90B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 3.3 70B Instruct のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 3.3 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 4 Maverick のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 4 Maverick のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Llama 4 Scout のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Llama 4 Scout のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Mistral Large 2 (24.07) のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Mistral Large 2 (24.07) のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Mistral Small のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Mistral Small のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Nova Lite V1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Nova Lite V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Nova Micro V1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Nova Micro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Nova Pro V1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン: 100 | なし | Nova Pro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| OpenAI GPT OSS 120b のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | OpenAI GPT OSS 120b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| OpenAI GPT OSS 20b のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | OpenAI GPT OSS 20b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Titan Multimodal Embeddings G1 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Titan Multimodal Embeddings G1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| DeepSeek v3 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | DeepSeek v3 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Qwen3 235B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Qwen3 235B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Qwen3 32B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Qwen3 32B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Qwen3 Coder 30B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Qwen3 Coder 30B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Qwen3 Coder 480B のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Qwen3 Coder 480B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| Titan Text Embeddings V2 のバッチ推論ジョブサイズ (GB) | サポートされている各リージョン:5 | なし | Titan Text Embeddings V2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。 |
| エージェント指示の文字 | サポートされている各リージョン: 20,000 | なし | エージェントに対する指示の最大文字数。 |
| 同時モデルインポートジョブ | サポートされている各リージョン: 1 | [いいえ] | 同時進行中のモデルインポートジョブの最大数。 |
| 1 秒あたりの CreateAgent リクエスト数 | サポートされている各リージョン: 6 | なし | 1 秒あたりの CreateAgent API リクエストの最大数。 |
| 1 秒あたりの CreateAgentActionGroup リクエスト数 | サポートされている各リージョン: 12 | なし | 1 秒あたりの CreateAgentActionGroup API リクエストの最大数。 |
| 1 秒あたりの CreateAgentAlias リクエスト数 | サポートされている各リージョン: 2 | なし | 1 秒あたりの CreateAgentAlias API リクエストの最大数。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | InvokeModel と InvokeModelWithResponseStream を 1 分間に呼び出すことができる最大回数。クォータには、Anthropic Claude 3.5 Haiku の InvokeModel トークンと InvokeModelWithResponseStream トークンの合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-west-2: 500 他のサポートされている各リージョン: 100 |
なし | Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 4,000,000 | あり |
モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-west-2: 4,000,000 他のサポートされている各リージョン: 800,000 |
あり |
Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-east-1: 4,000 us-east-2: 4,000 us-west-1: 4,000 us-west-2: 4,000 他のサポートされている各リージョン: 400 |
なし | Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-east-1: 4,000 us-east-2: 4,000 us-west-2: 4,000 他のサポートされている各リージョン: 400 |
なし | Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 500 | なし | Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 500 | なし | Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-east-1: 2,000 us-west-2: 2,000 ap-northeast-1: 400 ap-southeast-1: 400 他のサポートされている各リージョン: 800 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-east-1: 1,000 us-west-2: 1,000 他のサポートされている各リージョン: 200 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-west-2: 500 ap-northeast-1: 40 ap-southeast-1: 40 eu-central-1: 40 eu-west-1: 40 eu-west-3: 40 他のサポートされている各リージョン: 100 |
なし | Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 |
us-east-1: 250 us-east-2: 250 us-west-2: 250 eu-central-1: 100 eu-north-1: 100 eu-west-1: 100 eu-west-3: 100 他のサポートされている各リージョン: 50 |
なし | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 125 | あり |
Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 50 | なし | Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | あり |
Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 5 | あり |
Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | あり |
Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 5 | あり |
Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | なし | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | なし | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 1,600 | なし | Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 |
| Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Conservative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | なし | Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Control Sketch の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Control Sketch でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Control Structure の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Control Structure でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Creative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | なし | Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Erase Object の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Erase Object でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Fast Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Inpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Inpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Outpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 4 | なし | Stable Image Outpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Remove Background の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Remove Background でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Search and Recolor の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Search and Replace の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Search and Replace でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Style Guide の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Style Guide でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Style Transfer の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 20 | なし | Stable Image Style Transfer でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Twelve Labs Marengo の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Twelve Labs Marengo でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Twelve Labs Pegasus の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 120 | なし | Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-east-1: 8,000,000 us-east-2: 8,000,000 us-west-1: 8,000,000 us-west-2: 8,000,000 他のサポートされている各リージョン: 400,000 |
あり |
Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-east-1: 8,000,000 us-east-2: 8,000,000 us-west-2: 8,000,000 他のサポートされている各リージョン: 400,000 |
あり |
Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 2,000,000 | あり |
Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 2,000,000 | あり |
Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-east-1: 4,000,000 us-west-2: 4,000,000 ap-northeast-1: 400,000 ap-southeast-1: 400,000 他のサポートされている各リージョン: 600,000 |
あり |
モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 800,000 | あり |
Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-east-1: 2,000,000 us-west-2: 2,000,000 他のサポートされている各リージョン: 400,000 |
あり |
モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-west-2: 4,000,000 ap-northeast-1: 400,000 ap-southeast-1: 400,000 eu-central-1: 400,000 eu-west-1: 400,000 eu-west-3: 400,000 他のサポートされている各リージョン: 800,000 |
あり |
Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論トークン数 |
us-east-1: 1,000,000 us-east-2: 1,000,000 us-west-2: 1,000,000 eu-central-1: 100,000 eu-north-1: 100,000 eu-west-1: 100,000 eu-west-3: 100,000 他のサポートされている各リージョン: 50,000 |
あり |
Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 500,000 | あり |
Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 | あり |
Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 500,000 | あり |
Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 | あり |
Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | あり |
Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 | あり |
Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | あり |
Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 300,000 | あり |
Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 | あり |
DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 800,000 | あり |
Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 |
| Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 600,000 | あり |
Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 80,000 | あり |
Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 150,000 | あり |
Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 150,000 | あり |
Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| アカウントあたりの作成中ステータスのカスタムモデル | サポートされている各リージョン: 2 | あり |
作成中ステータスのカスタムモデルの最大数。 |
| 1 秒あたりの DeleteAgent リクエスト数 | サポートされている各リージョン: 2 | なし | DeleteAgent API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの DeleteAgentActionGroup リクエスト数 | サポートされている各リージョン: 2 | なし | DeleteAgentActionGroup API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの DeleteAgentAlias リクエスト数 | サポートされている各リージョン: 2 | なし | DeleteAgentAlias API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの DeleteAgentVersion リクエスト数 | サポートされている各リージョン: 2 | なし | DeleteAgentVersion API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの DisassociateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 4 | なし | DisassociateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 |
| エージェントあたりの有効アクショングループ数 | サポートされている各リージョン: 15 | 可能 |
エージェントで有効にできるアクショングループの最大数。 |
| 推論プロファイルあたりのエンドポイント数 | サポートされている各リージョン:5 | なし | 推論プロファイル内のエンドポイントの最大数。エンドポイントは、モデルと、モデルへの呼び出しリクエストの送信先のリージョンによって定義されます。 |
| 1 秒あたりの GetAgent リクエスト数 | サポートされている各リージョン: 15 | なし | GetAgent API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの GetAgentActionGroup リクエスト数 | サポートされている各リージョン: 20 | なし | GetAgentActionGroup API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの GetAgentAlias リクエスト数 | サポートされている各リージョン: 10 | なし | GetAgentAlias API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの GetAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 15 | なし | GetAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの GetAgentVersion リクエスト数 | サポートされている各リージョン: 10 | なし | GetAgentVersion API リクエストの 1 秒あたりの最大数。 |
| Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 250 | なし | Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン:5 | なし | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Haiku 4.5 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,440,000,000 | なし | Anthropic Claude Haiku 4.5 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 288,000,000 | なし | Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 720,000,000 | なし | Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,440,000,000 | なし | Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Embed V4 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 432,000,000 | なし | Cohere Embed V4 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | あり |
Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 200,000 | あり |
Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 500,000 | あり |
Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | あり |
Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数 | サポートされている各リージョン: 300,000 | あり |
Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| アカウントあたりのインポート済みモデル数 | サポートされている各リージョン: 3 | あり |
アカウント内のインポート済みモデルの最大数。 |
| アカウントあたりの推論プロファイル数 | サポートされている各リージョン: 1,000 | あり |
アカウント内の推論プロファイルの最大数。 |
| 1 秒あたりの ListAgentActionGroups リクエスト数 | サポートされている各リージョン: 10 | なし | ListAgentActionGroups API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの ListAgentAliases リクエスト数 | サポートされている各リージョン: 10 | なし | ListAgentAliases API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの ListAgentKnowledgeBases リクエスト数 | サポートされている各リージョン: 10 | なし | ListAgentKnowledgeBases API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの ListAgentVersions リクエスト数 | サポートされている各リージョン: 10 | なし | ListAgentVersions API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの ListAgents リクエスト数 | サポートされている各リージョン: 10 | なし | ListAgents API リクエストの 1 秒あたりの最大数。 |
| Amazon Nova Premier のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3 Haiku のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3 Opus のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3.5 Haiku のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | 可能 |
Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Claude Sonnet 4 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | 可能 |
Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| DeepSeek v3 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 4 Maverick のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Llama 4 Scout のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Mistral Small のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Nova Lite V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Nova Micro V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Nova Pro V1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Qwen3 235B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Qwen3 32B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Qwen3 Coder 30B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Qwen3 Coder 480B のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコードの最小数 | サポートされている各リージョン: 100 | なし | Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。 |
| Amazon Nova Premier V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 1,440,000,000 | なし | Amazon Nova Premier V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude 3.7 Sonnet V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | なし | Anthropic Claude 3.7 Sonnet V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Haiku 4.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 360,000,000 | なし | Anthropic Claude Haiku 4.5 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Opus 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | なし | Anthropic Claude Opus 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Opus 4.1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 360,000,000 | なし | Anthropic Claude Opus 4.1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Sonnet 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | なし | Anthropic Claude Sonnet 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Sonnet 4 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | なし | Anthropic Claude Sonnet 4 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | なし | Anthropic Claude Sonnet 4.5 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 720,000,000 | なし | Anthropic Claude Sonnet 4.5 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Cohere Embed V4 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 216,000,000 | なし | Cohere Embed V4 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| DeepSeek R1 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000 | なし | DeepSeek R1 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| DeepSeek V3 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | DeepSeek V3 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| OpenAI GPT OSS 120B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | OpenAI GPT OSS 120B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| OpenAI GPT OSS 20B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | OpenAI GPT OSS 20B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Qwen3 235B a22b 2507 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | Qwen3 235B a22b 2507 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Qwen3 32B V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | Qwen3 32B V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Qwen3 Coder 30B a3b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | Qwen3 Coder 30B a3b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| Qwen3 Coder 480B a35b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍) | サポートされている各リージョン: 144,000,000,000 | なし | Qwen3 Coder 480B a35b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。 |
| ベースモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数 | サポートされている各リージョン: 0 | あり |
ベースモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数 |
| カスタムモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数 | サポートされている各リージョン: 0 | あり |
カスタムモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数 |
| AI21 Labs Jurassic-2 Mid のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
AI21 Labs Jurassic-2 Mid のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Canvas のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Canvas のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Embeddings G1 – Text のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Embeddings G1 – Text のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Image Generator G1 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Image Generator G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Image Generator G2 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Image Generator G2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Lite V1 4K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Text Lite V1 4K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Text Embeddings V2 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Text Embeddings V2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Text G1 – Express 8K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Text G1 – Express 8K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Titan Text Premier V1 32K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Titan Text Premier V1 32K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3 Haiku 48K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3 Haiku 48K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude Instant V1 100K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude Instant V1 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude V2 100K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude V2 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude V2 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude V2.1 18K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude V2.1 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Anthropic Claude V2.1 200K のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Anthropic Claude V2.1 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Command のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Command のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Command Light のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Command Light のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Command R のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Command R 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Command R Plus のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Command R Plus 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Embed English のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Embed English のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Cohere Embed Multilingual のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Cohere Embed Multilingual のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 2 13B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 2 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 2 70B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 2 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 2 Chat 13B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 2 Chat 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 2 Chat 70B のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 2 Chat 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3 70B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3 8B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.1 70B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.1 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.1 8B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.1 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.2 11B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.2 11B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.2 1B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.2 1B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.2 3B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.2 3B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 3.2 90B Instruct のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 3.2 90B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Mistral Large 2407 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Mistral Large 2407 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Mistral Small のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Mistral Small のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数 | サポートされている各リージョン: 0 | あり |
Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。 |
| Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 |
| Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 |
| Meta Maverick 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 4 Maverick 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 |
| Meta Maverick 4 Scout 17B Instruct 1M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数 | サポートされている各リージョン: 0 | あり |
Meta Llama 4 Maverick 17B Instruct 1M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。 |
| アカウントあたりのカスタムプロンプトルーターの数 | サポートされている各リージョン: 500 | なし | 各リージョンのアカウントごとに作成できるカスタムプロンプトルーターの最大数。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 40,000 | なし | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 40,000 | なし | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova 2 Multimodal Embeddings V1 のオンデマンドの InvokeModel 非同期同時リクエスト数 | サポートされている各リージョン: 30 | なし | Amazon Nova 2 Multimodal Embeddings V1 で送信できる非同期の同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Reel1.0 のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 10 | なし | Amazon Nova Reel 1.0 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Reel1.1 のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 3 | なし | Amazon Nova Reel 1.1 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Sonic のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 20 | なし | Amazon Nova Sonic でモデル推論のために送信できる同時リクエストの最大数。 |
| Twelve Labs Marengo のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 30 | なし | Twelve Labs Marengo でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。 |
| Twelve Labs Pegasus のオンデマンドの InvokeModel 同時リクエスト数 | サポートされている各リージョン: 30 | なし | Twelve Labs Pegasus でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数 | サポートされている各リージョン: 500,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Luma Ray V2 のオンデマンドのモデル推論同時リクエスト数 | サポートされている各リージョン: 1 | [いいえ] | Luma Ray V2 でモデル推論のために送信できる同時リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | AI21 Labs Jamba 1.5 Large で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。 |
| AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | AI21 Labs Jamba 1.5 Mini で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。 |
| AI21 Labs Jamba Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | AI21 Labs Jamba Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。 |
| AI21 Labs Jurassic-2 Mid の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | AI21 Labs Jurassic-2 Mid で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| AI21 Labs Jurassic-2 Ultra の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | AI21 Labs Jurassic-2 Ultra で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Nova 2 Multimodal Embeddings V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Amazon Nova 2 Multimodal Embeddings V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Canvas の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | Amazon Nova Canvas でモデル推論のために 1 分間に送信できるリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Lite の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 2,000 eu-west-2: 2,000 他のサポートされている各リージョン: 200 |
なし | Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Micro の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 2,000 eu-west-2: 2,000 他のサポートされている各リージョン: 200 |
なし | Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Nova Pro の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 250 | なし | Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Rerank 1.0 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Amazon Rerank 1.0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Titan Image Generator G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Amazon Titan Image Generator G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Titan Text Embeddings の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Amazon Titan Text Embeddings で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 6,000 | なし | Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Amazon Titan Text Express の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Titan Text Lite の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Titan Text Premier の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 1,000 us-west-2: 1,000 ap-northeast-1: 200 ap-southeast-1: 200 他のサポートされている各リージョン: 400 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3 Opus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 50 | なし | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 500 us-west-2: 500 他のサポートされている各リージョン: 100 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-west-1: 400 他のサポートされている各リージョン: 1,000 |
なし | Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 50 us-east-2: 50 us-west-2: 250 ap-northeast-2: 50 ap-south-1: 50 ap-southeast-2: 50 他のサポートされている各リージョン: 20 |
なし | Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-west-2: 250 他のサポートされている各リージョン: 50 |
なし | Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 125 | なし | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Anthropic Claude Instant の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 1,000 us-west-2: 1,000 他のサポートされている各リージョン: 400 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude Instant の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数 |
us-east-1: 500 us-west-2: 500 他のサポートされている各リージョン: 100 |
なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude V2 の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Command の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Command Light の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command Light の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Command R の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Command R Plus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Embed English の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Cohere Embed English で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Cohere Embed Multilingual の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2,000 | なし | Cohere Embed Multilingual で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Cohere Embed V4 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 1,000 | なし | Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Cohere Rerank 3.5 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 250 | なし | Cohere Rerank 3.5 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| DeepSeek V3 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 2 13B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 2 70B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 2 Chat 13B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 Chat 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 2 Chat 70B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 Chat 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 200 | なし | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3.2 11B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 |
| Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 |
| Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3.2 90B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 |
| Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Mistral 7B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 800 | なし | Mistral mistral-7b-instruct-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Mistral AI Mistral Small の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Mistral AI Mistral Small で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。 |
| Mistral Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Mistral mistral-large-2402-v1 で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。 |
| Mistral Large 2407 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Mistral Large 2407 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。 |
| Mistral Mixtral 8x7b Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 400 | なし | Mistral mixtral-8x7b-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| OpenAI GPT OSS 120B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| OpenAI GPT OSS 20B の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Qwen3 32B V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10,000 | なし | Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stability.ai Stable Diffusion 3 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 15 | なし | Stability.ai Stable Diffusion 3 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Diffusion 3 Medium の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Stability.ai Stable Diffusion 3 Medium で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Diffusion 3.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 15 | なし | Stability.ai Stable Diffusion 3.5 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Diffusion XL 0.8 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Stability.ai Stable Diffusion XL 0.8 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Diffusion XL 1.0 の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Stability.ai Stable Diffusion XL 1.0 で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Image Core の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 90 | なし | Stability.ai Stable Image Core で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stability.ai Stable Image Ultra の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stability.ai Stable Image Ultra で 1 分間に InvokeModel を呼び出すことができる最大回数。 |
| Stable Image Conservative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | なし | Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Control Sketch の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Control Sketch でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Control Structure の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Control Structure でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Creative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | なし | Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Erase Object の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Erase Object でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Fast Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Inpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Inpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Outpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 2 | なし | Stable Image Outpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Remove Background の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Remove Background でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Search and Recolor の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Search and Replace の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Search and Replace でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Style Guide の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Style Guide でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Stable Image Style Transfer の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 10 | なし | Stable Image Style Transfer でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Twelve Labs Marengo の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 100 | なし | Twelve Labs Marengo でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。 |
| Twelve Labs Pegasus の 1 分あたりのオンデマンドのモデル推論リクエスト数 | サポートされている各リージョン: 60 | なし | Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | AI21 Labs Jamba 1.5 Large でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | AI21 Labs Jamba 1.5 Mini でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| AI21 Labs Jamba Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | AI21 Labs Jamba Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel のトークンの合計が考慮されます。 |
| AI21 Labs Jurassic-2 Mid の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、AI21 Labs Jurassic-2 Mid の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| AI21 Labs Jurassic-2 Ultra の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、AI21 Labs Jurassic-2 Ultra の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Amazon Nova Lite の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 4,000,000 eu-west-2: 4,000,000 他のサポートされている各リージョン: 200,000 |
なし | Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova Micro の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 4,000,000 eu-west-2: 4,000,000 他のサポートされている各リージョン: 200,000 |
なし | Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Nova Pro の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 1,000,000 | なし | Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Titan Image Generator G1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 2,000 | なし | Amazon Titan Image Generator G1 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 2,000 | なし | Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Amazon Titan Text Embeddings の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Amazon Titan Text Embeddings で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Amazon Titan Text Express の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Titan Text Lite の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Amazon Titan Text Premier の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 2,000,000 us-west-2: 2,000,000 ap-northeast-1: 200,000 ap-southeast-1: 200,000 他のサポートされている各リージョン: 300,000 |
なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Opus の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 400,000 | なし | Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 1,000,000 us-west-2: 1,000,000 他のサポートされている各リージョン: 200,000 |
なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドモデル推論トークン数 |
us-west-1: 300,000 他のサポートされている各リージョン: 2,000,000 |
なし | Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 400,000 us-east-2: 400,000 us-west-2: 2,000,000 ap-northeast-2: 400,000 ap-south-1: 400,000 ap-southeast-2: 400,000 他のサポートされている各リージョン: 200,000 |
なし | Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドモデル推論トークン数 |
us-west-2: 2,000,000 他のサポートされている各リージョン: 400,000 |
なし | Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 500,000 | なし | Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude Instant の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 1,000,000 us-west-2: 1,000,000 他のサポートされている各リージョン: 300,000 |
なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude Instant の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Anthropic Claude V2 の 1 分あたりのオンデマンドモデル推論トークン数 |
us-east-1: 500,000 us-west-2: 500,000 他のサポートされている各リージョン: 200,000 |
なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude V2 の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Command の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Command Light の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command Light の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。 |
| Cohere Command R の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Command R Plus の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Cohere Embed English の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Cohere Embed English で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Cohere Embed Multilingual の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Cohere Embed Multilingual で 1 分間に InvokeModel を通じて提供できるトークンの最大数。 |
| Cohere Embed V4 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 150,000 | なし | Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| DeepSeek V3 V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 2 13B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 2 70B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 2 Chat 13B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 Chat 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 2 Chat 70B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 Chat 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 400,000 | なし | Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.2 11B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 |
| Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 |
| Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.2 90B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 |
| Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral AI Mistral 7B Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral 7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral AI Mistral Large の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Large の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral AI Mistral Small の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Small の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral AI Mixtral 8X7BB Instruct の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mixtral 8X7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Mistral Large 2407 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 300,000 | なし | Mistral Large 2407 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。 |
| OpenAI GPT OSS 120B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| OpenAI GPT OSS 20B の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Qwen3 32B V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドモデル推論トークン数 | サポートされている各リージョン: 100,000,000 | なし | Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。 |
| 関数ごとのパラメータ数 | サポートされている各リージョン: 5 | あり |
アクショングループ関数に含めることができるパラメータの最大数。 |
| 1 秒あたりの PrepareAgent リクエスト数 | サポートされている各リージョン: 2 | なし | PrepareAgent API リクエストの 1 秒あたりの最大数。 |
| Amazon Nova Premier のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3 Haiku のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3 Opus のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3.5 Haiku のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Claude Sonnet 4 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| DeepSeek v3 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 4 Maverick のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Llama 4 Scout のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Mistral Small のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Nova Lite V1 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Nova Micro V1 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Nova Pro V1 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Qwen3 235B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Qwen3 32B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Qwen3 Coder 30B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Qwen3 Coder 480B のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコード数 | サポートされている各リージョン:50,000 | あり |
Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。 |
| Amazon Nova Premier のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Amazon Nova Premier のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3 Opus のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Opus のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3.5 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3.5 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.5 Sonnet v2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude 3.7 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude 3.7 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Claude Sonnet 4 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Claude Sonnet 4 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| DeepSeek v3 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
DeepSeek v3 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.1 405B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 405B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.1 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.1 8B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.1 8B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.2 11B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 11B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.2 1B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 1B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.2 3B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 3B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.2 90B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.2 90B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 3.3 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 3.3 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 4 Maverick のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 4 Maverick のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Llama 4 Scout のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Llama 4 Scout のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Mistral Large 2 (24.07) のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Mistral Large 2 (24.07) のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Mistral Small のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Mistral Small のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Nova Lite V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Lite V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Nova Micro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Micro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Nova Pro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Nova Pro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| OpenAI GPT OSS 120b のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
OpenAI GPT OSS 120b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| OpenAI GPT OSS 20b のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
OpenAI GPT OSS 20b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Qwen3 235B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 235B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Qwen3 32B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 32B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Qwen3 Coder 30B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 Coder 30B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Qwen3 Coder 480B のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Qwen3 Coder 480B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Titan Multimodal Embeddings G1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Titan Text Embeddings V2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数 | サポートされている各リージョン:50,000 | あり |
Titan Text Embeddings V2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。 |
| Amazon Nova Premier のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Amazon Nova Premier のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3 Opus のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3 Opus のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3.5 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3.5 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3.5 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3.5 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3.5 Sonnet v2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3.5 Sonnet v2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude 3.7 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude 3.7 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Claude Sonnet 4 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Claude Sonnet 4 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| DeepSeek v3 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
DeepSeek v3 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.1 405B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.1 405B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.1 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.1 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.1 8B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.1 8B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.2 11B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.2 11B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.2 1B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.2 1B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.2 3B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.2 3B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.2 90B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.2 90B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 3.3 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 3.3 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 4 Maverick のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 4 Maverick のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Llama 4 Scout のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Llama 4 Scout のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Mistral Large 2 (24.07) のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Mistral Large 2 (24.07) のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Mistral Small のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Mistral Small のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Nova Lite V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Nova Lite V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Nova Micro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Nova Micro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Nova Pro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Nova Pro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| OpenAI GPT OSS 120b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
OpenAI GPT OSS 120b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| OpenAI GPT OSS 20b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
OpenAI GPT OSS 20b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Qwen3 235B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Qwen3 235B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Qwen3 32B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Qwen3 32B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Qwen3 Coder 30B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Qwen3 Coder 30B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Qwen3 Coder 480B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Qwen3 Coder 480B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Titan Multimodal Embeddings G1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Titan Multimodal Embeddings G1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Titan Text Embeddings V2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 20 | 可能 |
Titan Text Embeddings V2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Titan Multimodal Embeddings G1 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 3 | なし | Titan Multimodal Embeddings G1 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Titan Text Embeddings V2 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計 | サポートされている各リージョン: 3 | なし | Titan Text Embeddings V2 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。 |
| Bedrock Data Automation ランタイムのスロットルレート制限: ListTagsForResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数 |
| Bedrock Data Automation ランタイムのスロットルレート制限: TagResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数 |
| Bedrock Data Automation ランタイムのスロットルレート制限: UntagResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数 |
| Bedrock Data Automation のスロットルレート制限: ListTagsForResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数 |
| Bedrock Data Automation のスロットルレート制限: TagResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数 |
| Bedrock Data Automation のスロットルレート制限: UntagResource | サポートされている各リージョン: 25/秒 | なし | Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数 |
| CreateBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprint リクエストの最大数 |
| CreateBlueprintVersion のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprintVersion リクエストの最大数 |
| CreateDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateDataAutomationProject リクエストの最大数 |
| DeleteBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteBlueprint リクエストの最大数 |
| DeleteDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteDataAutomationProject リクエストの最大数 |
| GetBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetBlueprint リクエストの最大数 |
| GetDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationProject リクエストの最大数 |
| GetDataAutomationStatus のスロットルレート制限 | サポートされている各リージョン:10/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationStatus リクエストの最大数 |
| InvokeDataAutomationAsync のスロットルレート制限 | サポートされている各リージョン:10/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる InvokeDataAutomationAsync リクエストの最大数 |
| ListBlueprints のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListBlueprints リクエストの最大数 |
| ListDataAutomationProjects のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListDataAutomationProjects リクエストの最大数 |
| UpdateBlueprint のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateBlueprint リクエストの最大数 |
| UpdateDataAutomationProject のスロットルレート制限 | サポートされている各リージョン: 5/秒 | なし | 現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateDataAutomationProject リクエストの最大数 |
| 1 秒あたりの UpdateAgent リクエスト数 | サポートされている各リージョン: 4 | なし | UpdateAgent API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの UpdateAgentActionGroup リクエスト数 | サポートされている各リージョン: 6 | なし | UpdateAgentActionGroup API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの UpdateAgentAlias リクエスト数 | サポートされている各リージョン: 2 | なし | UpdateAgentAlias API リクエストの 1 秒あたりの最大数。 |
| 1 秒あたりの UpdateAgentKnowledgeBase リクエスト数 | サポートされている各リージョン: 4 | なし | UpdateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。 |
注記
アカウントのクォータ引き上げをリクエストするには、以下のステップを実行します。
-
クォータが [あり] とマークされている場合は、「Service Quotas ユーザーガイド」の「Requesting a Quota Increase」に記載の手順でクォータを調整できます。
-
クォータが [なし] とマークされている場合は、制限引き上げのフォーム
を使用して引き上げを検討するようリクエストを送信できます。 -
モデルを問わず、以下のクォータの引き上げを一緒にリクエストすることができます。
-
${model}の 1 分あたりのクロスリージョン InvokeModel トークン -
${model}の 1 分あたりのクロスリージョン InvokeModel リクエスト -
${model}の 1 分あたりのオンデマンド InvokeModel トークン -
${model}の 1 分あたりのオンデマンド InvokeModel リクエスト
上記のクォータの任意の組み合わせの引き上げをリクエストするには、「Service Quotas ユーザーガイド」の「Requesting a Quota Increase」に記載の手順に沿って
${model}の 1 分あたりのクロスリージョン InvokeModel トークンのクォータの引き上げをリクエストしてください。その後、サポートチームからお客様にご連絡し、その他の 3 つのクォータを引き上げるオプションを提供いたします。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様に優先権が与えられます。この条件を満たしていない場合、リクエストは拒否されることがあります。 -