Amazon Bedrock サービスエンドポイント Amazon Bedrock サービスクォータ

Amazon Bedrock エンドポイントとクォータ

プログラムで AWS サービスに接続するには、endpoint. AWS services は、サービスがサポートする一部またはすべての AWS リージョンで、IPv4 エンドポイント、デュアルスタックエンドポイント、および FIPS エンドポイントのエンドポイントタイプを提供します。一部のサービスにはグローバルエンドポイントが用意されています。詳細については、「AWS サービスエンドポイント」を参照してください。

制限とも呼ばれるサービスクォータは、 AWS アカウントのサービスリソースまたはオペレーションの最大数です。詳細については、「AWS サービスクォータ」を参照してください。

このサービスのサービスエンドポイントおよび Service Quotas を以下に示します。

Amazon Bedrock サービスエンドポイント

Amazon Bedrock コントロールプレーン API

次の表は、Amazon Bedrock でモデルの管理、トレーニング、およびデプロイがサポートされている、リージョン固有のエンドポイントの一覧です。Amazon Bedrock API オペレーションには、これらのエンドポイントを使用します。

リージョン名	リージョン	エンドポイント	プロトコル
米国東部 (オハイオ)	us-east-2	bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com	HTTPS HTTPS
米国東部 (バージニア北部)	us–east–1	bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com	HTTPS HTTPS
米国西部 (北カリフォルニア)	us-west-1	bedrock.us-west-1.amazonaws.com bedrock-fips.us-west-1.amazonaws.com	HTTPS HTTPS
米国西部 (オレゴン)	us-west-2	bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com	HTTPS HTTPS
アフリカ (ケープタウン)	af-south-1	bedrock.af-south-1.amazonaws.com	HTTPS
アジアパシフィック (ハイデラバード)	ap-south-2	bedrock.ap-south-2.amazonaws.com	HTTPS
アジアパシフィック (ジャカルタ)	ap-southeast-3	bedrock.ap-southeast-3.amazonaws.com	HTTPS
アジアパシフィック (マレーシア)	ap-southeast-5	bedrock.ap-southeast-5.amazonaws.com	HTTPS
アジアパシフィック (メルボルン)	ap-southeast-4	bedrock.ap-southeast-4.amazonaws.com	HTTPS
アジアパシフィック (ムンバイ)	ap-south-1	bedrock.ap-south-1.amazonaws.com	HTTPS
アジアパシフィック (ニュージーランド)	ap-southeast-6	bedrock.ap-southeast-6.amazonaws.com	HTTPS
アジアパシフィック (大阪)	ap-northeast-3	bedrock.ap-northeast-3.amazonaws.com	HTTPS
アジアパシフィック (ソウル)	ap-northeast-2	bedrock.ap-northeast-2.amazonaws.com	HTTPS
アジアパシフィック (シンガポール)	ap-southeast-1	bedrock.ap-southeast-1.amazonaws.com	HTTPS
アジアパシフィック (シドニー)	ap-southeast-2	bedrock.ap-southeast-2.amazonaws.com	HTTPS
アジアパシフィック (台北)	ap-east-2	bedrock.ap-east-2.amazonaws.com	HTTPS
アジアパシフィック (タイ)	ap-southeast-7	bedrock.ap-southeast-7.amazonaws.com	HTTPS
アジアパシフィック (東京)	ap-northeast-1	bedrock.ap-northeast-1.amazonaws.com	HTTPS
カナダ (中部)	ca-central-1	bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
カナダ西部 (カルガリー)	ca-west-1	bedrock.ca-west-1.amazonaws.com bedrock-fips.ca-west-1.amazonaws.com	HTTPS HTTPS
欧州 (フランクフルト)	eu-central-1	bedrock.eu-central-1.amazonaws.com	HTTPS
欧州 (アイルランド)	eu-west-1	bedrock.eu-west-1.amazonaws.com	HTTPS
欧州 (ロンドン)	eu-west-2	bedrock.eu-west-2.amazonaws.com	HTTPS
ヨーロッパ (ミラノ)	eu-south-1	bedrock.eu-south-1.amazonaws.com	HTTPS
欧州 (パリ)	eu-west-3	bedrock.eu-west-3.amazonaws.com	HTTPS
欧州 (スペイン)	eu-south-2	bedrock.eu-south-2.amazonaws.com	HTTPS
欧州 (ストックホルム)	eu-north-1	bedrock.eu-north-1.amazonaws.com	HTTPS
欧州 (チューリッヒ)	eu-central-2	bedrock.eu-central-2.amazonaws.com	HTTPS
イスラエル (テルアビブ)	il-central-1	bedrock.il-central-1.amazonaws.com	HTTPS
メキシコ (中部)	mx-central-1	bedrock.mx-central-1.amazonaws.com	HTTPS
中東 (バーレーン)	me-south-1	bedrock.me-south-1.amazonaws.com	HTTPS
中東 (アラブ首長国連邦)	me-central-1	bedrock.me-central-1.amazonaws.com	HTTPS
南米 (サンパウロ)	sa-east-1	bedrock.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (米国東部)	us-gov-east-1	bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (米国西部)	us-gov-west-1	bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Amazon Bedrock ランタイム API

次の表は、Amazon Bedrock でホストされるモデルに対して推論リクエストを行うために Amazon Bedrock でサポートされているリージョン固有のエンドポイントの一覧です。Amazon Bedrock ランタイム API オペレーションには、これらのエンドポイントを使用します。

リージョン名	リージョン	エンドポイント	プロトコル
米国東部 (オハイオ)	us-east-2	bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS
米国東部 (バージニア北部)	us–east–1	bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com	HTTPS HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com	HTTPS HTTPS
アジアパシフィック (ハイデラバード)	ap-south-2	bedrock-runtime.ap-south-2.amazonaws.com	HTTPS
アジアパシフィック (ムンバイ)	ap-south-1	bedrock-runtime.ap-south-1.amazonaws.com	HTTPS
アジアパシフィック (大阪)	ap-northeast-3	bedrock-runtime.ap-northeast-3.amazonaws.com	HTTPS
アジアパシフィック (ソウル)	ap-northeast-2	bedrock-runtime.ap-northeast-2.amazonaws.com	HTTPS
アジアパシフィック (シンガポール)	ap-southeast-1	bedrock-runtime.ap-southeast-1.amazonaws.com	HTTPS
アジアパシフィック (シドニー)	ap-southeast-2	bedrock-runtime.ap-southeast-2.amazonaws.com	HTTPS
アジアパシフィック (東京)	ap-northeast-1	bedrock-runtime.ap-northeast-1.amazonaws.com	HTTPS
カナダ (中部)	ca-central-1	bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
欧州 (フランクフルト)	eu-central-1	bedrock-runtime.eu-central-1.amazonaws.com	HTTPS
欧州 (アイルランド)	eu-west-1	bedrock-runtime.eu-west-1.amazonaws.com	HTTPS
欧州 (ロンドン)	eu-west-2	bedrock-runtime.eu-west-2.amazonaws.com	HTTPS
ヨーロッパ (ミラノ)	eu-south-1	bedrock-runtime.eu-south-1.amazonaws.com	HTTPS
欧州 (パリ)	eu-west-3	bedrock-runtime.eu-west-3.amazonaws.com	HTTPS
欧州 (スペイン)	eu-south-2	bedrock-runtime.eu-south-2.amazonaws.com	HTTPS
欧州 (ストックホルム)	eu-north-1	bedrock-runtime.eu-north-1.amazonaws.com	HTTPS
欧州 (チューリッヒ)	eu-central-2	bedrock-runtime.eu-central-2.amazonaws.com	HTTPS
南米 (サンパウロ)	sa-east-1	bedrock-runtime.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (米国東部)	us-gov-east-1	bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (米国西部)	us-gov-west-1	bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Agents for Amazon Bedrock ビルドタイム API

次の表は、エージェントとナレッジベースの作成と管理のために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。Amazon Bedrock エージェント API オペレーションには、これらのエンドポイントを使用します。

リージョン名	リージョン	エンドポイント	プロトコル
米国東部 (バージニア北部)	us–east–1	bedrock-agent.us-east-1.amazonaws.com	HTTPS
米国東部 (バージニア北部)	us–east–1	bedrock-agent-fips.us-east-1.amazonaws.com	HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-agent.us-west-2.amazonaws.com	HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-agent-fips.us-west-2.amazonaws.com	HTTPS
アジアパシフィック (シンガポール)	ap-southeast-1	bedrock-agent.ap-southeast-1.amazonaws.com	HTTPS
アジアパシフィック (シドニー)	ap-southeast-2	bedrock-agent.ap-southeast-2.amazonaws.com	HTTPS
アジアパシフィック (東京)	ap-northeast-1	bedrock-agent.ap-northeast-1.amazonaws.com	HTTPS
アジアパシフィック (ソウル)	ap-northeast-2	bedrock-agent.ap-northeast-2.amazonaws.com	HTTPS
カナダ (中部)	ca-central-1	bedrock-agent.ca-central-1.amazonaws.com	HTTPS
欧州 (フランクフルト)	eu-central-1	bedrock-agent.eu-central-1.amazonaws.com	HTTPS
欧州 (アイルランド)	eu-west-1	bedrock-agent.eu-west-1.amazonaws.com	HTTPS
欧州 (ロンドン)	eu-west-2	bedrock-agent.eu-west-2.amazonaws.com	HTTPS
欧州 (パリ)	eu-west-3	bedrock-agent.eu-west-3.amazonaws.com	HTTPS
アジアパシフィック (ムンバイ)	ap-south-1	bedrock-agent.ap-south-1.amazonaws.com	HTTPS
南米 (サンパウロ)	sa-east-1	bedrock-agent.sa-east-1.amazonaws.com	HTTPS

Agents for Amazon Bedrock ランタイム API

次の表は、エージェントの呼び出しとナレッジベースのクエリのために Amazon Bedrock エージェントがサポートするリージョン固有のエンドポイントの一覧です。Amazon Bedrock エージェントのランタイム API オペレーションには、これらのエンドポイントを使用します。

リージョン名	リージョン	エンドポイント	プロトコル
米国東部 (バージニア北部)	us–east–1	bedrock-agent-runtime.us-east-1.amazonaws.com	HTTPS
米国東部 (バージニア北部)	us–east–1	bedrock-agent-runtime-fips.us-east-1.amazonaws.com	HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-agent-runtime.us-west-2.amazonaws.com	HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-agent-runtime-fips.us-west-2.amazonaws.com	HTTPS
アジアパシフィック (シンガポール)	ap-southeast-1	bedrock-agent-runtime.ap-southeast-1.amazonaws.com	HTTPS
アジアパシフィック (シドニー)	ap-southeast-2	bedrock-agent-runtime.ap-southeast-2.amazonaws.com	HTTPS
アジアパシフィック (東京)	ap-northeast-1	bedrock-agent-runtime.ap-northeast-1.amazonaws.com	HTTPS
アジアパシフィック (ソウル)	ap-northeast-2	bedrock-agent-runtime.ap-northeast-2.amazonaws.com	HTTPS
カナダ (中部)	ca-central-1	bedrock-agent-runtime.ca-central-1.amazonaws.com	HTTPS
欧州 (フランクフルト)	eu-central-1	bedrock-agent-runtime.eu-central-1.amazonaws.com	HTTPS
欧州 (パリ)	eu-west-3	bedrock-agent-runtime.eu-west-3.amazonaws.com	HTTPS
欧州 (アイルランド)	eu-west-1	bedrock-agent-runtime.eu-west-1.amazonaws.com	HTTPS
欧州 (ロンドン)	eu-west-2	bedrock-agent-runtime.eu-west-2.amazonaws.com	HTTPS
アジアパシフィック (ムンバイ)	ap-south-1	bedrock-agent-runtime.ap-south-1.amazonaws.com	HTTPS
南米 (サンパウロ)	sa-east-1	bedrock-agent-runtime.sa-east-1.amazonaws.com	HTTPS

Amazon Bedrock Data Automation API

次の表は、Amazon Bedrock Data Automation でサポートされているリージョン固有のエンドポイントの一覧です。runtime という単語を使用するエンドポイントは、ブループリントとプロジェクトを呼び出し、ファイルから情報を抽出します。Amazon Bedrock Data Automation ランタイム API オペレーションには、これらのエンドポイントを使用します。runtime を使用しないエンドポイントはブループリントとプロジェクトの作成に使用され、抽出に関するガイダンスを提供します。Amazon Bedrock Data Automation API Buildtime オペレーションには、これらのエンドポイントを使用します。

リージョン名	リージョン	エンドポイント	プロトコル
米国東部 (バージニア北部)	us–east–1	bedrock-data-automation.us-east-1.amazonaws.com bedrock-data-automation-runtime.us-east-1.api.aws bedrock-data-automation-runtime.us-east-1.amazonaws.com bedrock-data-automation.us-east-1.api.aws bedrock-data-automation-fips.us-east-1.amazonaws.com bedrock-data-automation-runtime-fips.us-east-1.api.aws bedrock-data-automation-runtime-fips.us-east-1.amazonaws.com bedrock-data-automation-fips.us-east-1.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
米国西部 (オレゴン)	us-west-2	bedrock-data-automation.us-west-2.amazonaws.com bedrock-data-automation-runtime.us-west-2.api.aws bedrock-data-automation-runtime.us-west-2.amazonaws.com bedrock-data-automation.us-west-2.api.aws bedrock-data-automation-fips.us-west-2.amazonaws.com bedrock-data-automation-runtime-fips.us-west-2.api.aws bedrock-data-automation-runtime-fips.us-west-2.amazonaws.com bedrock-data-automation-fips.us-west-2.api.aws	HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS HTTPS
アジアパシフィック (ムンバイ)	ap-south-1	bedrock-data-automation.ap-south-1.amazonaws.com bedrock-data-automation-runtime.ap-south-1.amazonaws.com	HTTPS HTTPS
アジアパシフィック (シドニー)	ap-southeast-2	bedrock-data-automation.ap-southeast-2.amazonaws.com bedrock-data-automation-runtime.ap-southeast-2.amazonaws.com	HTTPS HTTPS
欧州 (フランクフルト)	eu-central-1	bedrock-data-automation.eu-central-1.amazonaws.com bedrock-data-automation-runtime.eu-central-1.amazonaws.com	HTTPS HTTPS
欧州 (アイルランド)	eu-west-1	bedrock-data-automation.eu-west-1.amazonaws.com bedrock-data-automation-runtime.eu-west-1.amazonaws.com	HTTPS HTTPS
欧州 (ロンドン)	eu-west-2	bedrock-data-automation.eu-west-2.amazonaws.com bedrock-data-automation-runtime.eu-west-2.amazonaws.com	HTTPS HTTPS
AWS GovCloud (米国西部)	us-gov-west-1	bedrock-data-automation.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime.us-gov-west-1.amazonaws.com bedrock-data-automation-fips.us-gov-west-1.amazonaws.com bedrock-data-automation-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS HTTPS HTTPS

Amazon Bedrock サービスクォータ

ヒント

Amazon Bedrock には多数のクォータがあるため、サービスクォータの表示には以下の表ではなくコンソールを使用することをお勧めします。Amazon Bedrock クォータを開きます。特定のクォータを検索するには、検索フィールドを使用します。歯車アイコンを使用して、ページに表示されるクォータの数を制御できます。

名前	デフォルト	引き上げ可能	説明
(高度なプロンプト最適化) アカウントあたりのアクティブなジョブ	サポートされている各リージョン: 20	不可	アカウントあたりのアクティブな高度なプロンプト最適化 (APO) ジョブの最大数。
(高度なプロンプト最適化) アカウントあたりの非アクティブなジョブ	サポートされている各リージョン: 5,000	不可	アカウントあたりの非アクティブな高度なプロンプト最適化 (APO) ジョブの最大数。
(自動推論) ポリシーの注釈	サポートされている各リージョン: 10	不可	自動推論ポリシーの注釈の最大数。
(自動推論) 1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの CancelAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。
(自動推論) ポリシーあたりの同時ビルド数	サポートされている各リージョン: 2	不可	自動推論ポリシーあたりの同時ビルドの最大数。
(自動推論) アカウントあたりの同時ポリシービルド数	サポートされている各リージョン：5	不可	1 つのアカウントでの同時自動推論ポリシービルドの最大数。
(自動推論) 1 秒あたりの CreateAutomatedReasoningPolicy リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの CreateAutomatedReasoningPolicy API リクエストの最大数。
(自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyTestCase リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの CreateAutomatedReasoningPolicyTestCase API リクエストの最大数。
(自動推論) 1 秒あたりの CreateAutomatedReasoningPolicyVersion リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの CreateAutomatedReasoningPolicyVersion API リクエストの最大数。
(自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicy リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの DeleteAutomatedReasoningPolicy API リクエストの最大数。
(自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの DeleteAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。
(自動推論) 1 秒あたりの DeleteAutomatedReasoningPolicyTestCase リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの DeleteAutomatedReasoningPolicyTestCase API リクエストの最大数。
(自動推論) 1 秒あたりの ExportAutomatedReasoningPolicyVersion リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの ExportAutomatedReasoningPolicyVersion API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicy リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicy API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyAnnotations リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyAnnotations API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyBuildWorkflowResultAssets API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyNextScenario リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyNextScenario API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestCase リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyTestCase API リクエストの最大数。
(自動推論) 1 秒あたりの GetAutomatedReasoningPolicyTestResult リクエスト数	サポートされている各リージョン: 10	あり	1 秒あたりの GetAutomatedReasoningPolicyTestResult API リクエストの最大数。
(自動推論) 1 秒あたりの ListAutomatedReasoningPolicies リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの ListAutomatedReasoningPolicies API リクエストの最大数。
(自動推論) 1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの ListAutomatedReasoningPolicyBuildWorkflows API リクエストの最大数。
(自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestCases リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの ListAutomatedReasoningPolicyTestCases API リクエストの最大数。
(自動推論) 1 秒あたりの ListAutomatedReasoningPolicyTestResults リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの ListAutomatedReasoningPolicyTestResults API リクエストの最大数。
(自動推論) アカウントごとのポリシー	サポートされている各リージョン: 100	不可	1 つのアカウント内の自動推論ポリシーの最大数。
(自動推論) ポリシーのルール	サポートされている各リージョン: 500	不可	自動推論ポリシーのルールの最大数。
(自動推論) ソースドキュメントサイズ (MB)	サポートされている各リージョン：5	不可	自動推論ポリシーを作成するためのソースドキュメントの最大サイズ (MB)。
(自動推論) ソースドキュメントトークン	サポートされている各リージョン: 122,880	不可	自動推論ポリシーの作成時にソースドキュメントで許可されるトークンの最大数。
(自動推論) 1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow リクエスト数	サポートされている各リージョン: 1	あり	1 秒あたりの StartAutomatedReasoningPolicyBuildWorkflow API リクエストの最大数。
(自動推論) 1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow リクエスト数	サポートされている各リージョン: 1	あり	1 秒あたりの StartAutomatedReasoningPolicyTestWorkflow API リクエストの最大数。
(自動推論) ポリシーごとのテスト	サポートされている各リージョン: 100	不可	自動推論ポリシーごとのテストの最大数。
(自動推論) ポリシーごとのタイプ	サポートされている各リージョン: 50	不可	自動推論ポリシーごとのタイプの最大数。
(自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicy リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの UpdateAutomatedReasoningPolicy API リクエストの最大数。
(自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの UpdateAutomatedReasoningPolicyAnnotations API リクエストの最大数。
(自動推論) 1 秒あたりの UpdateAutomatedReasoningPolicyTestCase リクエスト数	サポートされている各リージョン： 5	あり	1 秒あたりの UpdateAutomatedReasoningPolicyTestCase API リクエストの最大数。
(自動推論) ポリシーのタイプごとの値	サポートされている各リージョン: 50	不可	自動推論ポリシーのタイプごとの値の最大数。
(自動推論) ポリシーの変数	サポートされている各リージョン: 200	不可	自動推論ポリシー内の変数の最大数。
(自動推論) ポリシーごとのバージョン	サポートされている各リージョン: 1,000	不可	自動推論ポリシーごとのバージョンの最大数。
(データ自動化) (コンソール) ドキュメントの最大ファイルサイズ (MB)	サポートされている各リージョン: 200	不可	コンソールの最大ファイルサイズ
(データ自動化) (コンソール) ドキュメントファイルあたりの最大ページ数	サポートされている各リージョン: 20	不可	コンソールのドキュメントあたりの最大ページ数
(データ自動化) CreateBlueprint – アカウントあたりのブループリントの最大数	サポートされている各リージョン: 350	あり	アカウントあたりのブループリントの最大数
(データ自動化) CreateBlueprintVersion – ブループリントごとのブループリントバージョンの最大数	サポートされている各リージョン: 10	あり	ブループリントあたりのバージョンの最大数
(データ自動化) フィールドの説明の長さ (文字)	サポートされている各リージョン: 300	不可	フィールドの説明の最大文字数
(データ自動化) InvokeBlueprintOptimizationAsync - ブループリント最適化の同時ジョブの最大数	サポートされている各リージョン: 3	あり	ブループリント最適化非同期オープンジョブの呼び出しの最大数
(データ自動化) InvokeBlueprintOptimizationAsync - 1 日あたりのブループリント最適化ジョブの最大数	サポートされている各リージョン: 30	不可	1 日あたりのブループリント最適化非同期ジョブの呼び出しの最大数
(データ自動化) InvokeDataAutomation(Sync) - ドキュメント - 最大リクエスト数	サポートされている各リージョン: 60	あり	ドキュメントモダリティの 1 分あたりの InvokeDataAutomation リクエストの最大数
(データ自動化) InvokeDataAutomation(Sync) - イメージ - 最大リクエスト数	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 100	あり	イメージモダリティの 1 分あたりの InvokeDataAutomation リクエストの最大数
(データ自動化) InvokeDataAutomationAsync – 音声 – 同時ジョブの最大数	us-east-1: 20 us-west-2: 20 他のサポートされている各リージョン: 2	あり	音声用のデータ自動化の非同期呼び出しのオープンジョブの最大数
(データ自動化) InvokeDataAutomationAsync – ドキュメント – 同時ジョブの最大数	us-east-1: 25 us-west-2: 25 他のサポートされている各リージョン: 5	あり	ドキュメント用のデータ自動化の非同期呼び出しのオープンジョブの最大数
(データ自動化) InvokeDataAutomationAsync – 画像 – 同時ジョブの最大数	us-east-1: 20 us-west-2: 20 他のサポートされている各リージョン: 5	あり	画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数
(データ自動化) InvokeDataAutomationAsync – オープンジョブの最大数	サポートされている各リージョン: 1,800	不可	画像用のデータ自動化の非同期呼び出しのオープンジョブの最大数
(データ自動化) InvokeDataAutomationAsync – 動画 – 同時ジョブの最大数	us-east-1: 20 us-west-2: 20 サポートされている他の各リージョン: 3	あり	動画用のデータ自動化の非同期呼び出しのオープンジョブの最大数
(データ自動化) 音声の最大サンプルレート (Hz)	サポートされている各リージョン: 48,000	不可	音声の最大サンプルレート
(データ自動化) プロジェクトあたりのブループリントの最大数 (音声)	サポートされている各リージョン: 1	[いいえ]	音声のプロジェクトあたりのブループリントの最大数
(データ自動化) プロジェクトあたりのブループリントの最大数 (ドキュメント)	サポートされている各リージョン: 40	不可	ドキュメントのプロジェクトあたりのブループリントの最大数
(データ自動化) プロジェクトあたりのブループリントの最大数 (画像)	サポートされている各リージョン: 1	[いいえ]	画像のプロジェクトあたりのブループリントの最大数
(データ自動化) プロジェクトあたりのブループリントの最大数 (動画)	サポートされている各リージョン: 1	[いいえ]	動画のプロジェクトあたりのブループリントの最大数
(データ自動化) JSON ブループリントの最大サイズ (文字)	サポートされている各リージョン: 100,000	不可	文字単位の JSON の最大サイズ
(データ自動化) フィールド階層の最大レベル	サポートされている各リージョン: 1	[いいえ]	フィールド階層の最大数レベル
(データ自動化) ドキュメントあたりの最大ページ数	サポートされている各リージョン: 3,000	不可	ドキュメントあたりの最大ページ数
(データ自動化) 最大解像度	サポートされている各リージョン: 8,000	不可	画像の最大解像度
(データ自動化) 音声ファイルの最大サイズ (MB)	サポートされている各リージョン: 2,048	不可	音声の最大ファイルサイズ
(データ自動化) 音声の最大長 (分)	サポートされている各リージョン: 240	不可	分単位の音声の最大長
(データ自動化) ドキュメントファイルの最大サイズ (MB)	サポートされている各リージョン: 500	不可	ファイルの最大サイズ
(データ自動化) 画像ファイルの最大サイズ (MB)	サポートされている各リージョン：5	不可	画像の最大ファイルサイズ
(データ自動化) 推論開始リクエストあたりのブループリントの最大数 (音声)	サポートされている各リージョン: 1	[いいえ]	推論開始リクエストのインラインブループリントの最大数
(データ自動化) 推論開始リクエストあたりのブループリントの最大数 (ドキュメント)	サポートされている各リージョン: 10	不可	推論開始リクエストのインラインブループリントの最大数
(データ自動化) 推論開始リクエストあたりのブループリントの最大数 (画像)	サポートされている各リージョン: 1	[いいえ]	推論開始リクエストのインラインブループリントの最大数
(データ自動化) 推論開始リクエストあたりのブループリントの最大数 (動画)	サポートされている各リージョン: 1	[いいえ]	推論開始リクエストのインラインブループリントの最大数
(データ自動化) ブループリントあたりのリストフィールドの最大数	サポートされている各リージョン: 15	不可	ブループリントあたりのリストフィールドの最大数
(データ自動化) 動画ファイルの最大サイズ (MB)	サポートされている各リージョン: 10,240	不可	動画の最大ファイルサイズ
(データ自動化) 動画の最大長 (分)	サポートされている各リージョン: 240	不可	分単位の動画の最大長
(データ自動化) 音声の最小サンプルレート (Hz)	サポートされている各リージョン: 8,000	不可	音声の最小サンプルレート
(データ自動化) 音声の最小長 (ミリ秒)	サポートされている各リージョン: 500	不可	ミリ秒単位の音声の最小長
(評価) 同時自動モデル評価ジョブの数	サポートされている各リージョン: 20	不可	このアカウントで現在のリージョンに一度に指定できる自動モデル評価ジョブの最大数。
(評価) ヒューマンワーカーを使用する同時モデル評価ジョブの数	サポートされている各リージョン: 10	不可	このアカウントで現在のリージョンに一度に指定できるヒューマンワーカーを使用するモデル評価ジョブの最大数。
(評価) カスタムメトリクスの数	サポートされている各リージョン: 10	不可	ヒューマンワーカーを使用するモデル評価ジョブで指定できるカスタムメトリクスの最大数。
(評価) 人間ベースのモデル評価ジョブのカスタムプロンプトデータセットの数	サポートされている各リージョン: 1	[いいえ]	このアカウントで現在のリージョンに人間ベースのモデル評価ジョブで指定できるカスタムプロンプトデータセットの最大数。
(評価) ジョブあたりのデータセットの数	サポートされている各リージョン：5	不可	自動モデル評価ジョブで指定できるデータセットの最大数。これには、カスタムプロンプトデータセットと組み込みプロンプトデータセットの両方が含まれます。
(評価) 評価ジョブの数	サポートされている各リージョン: 5,000	不可	このアカウントで現在のリージョンに作成できるモデル評価ジョブの最大数。
(評価) データセットあたりのメトリクスの数	サポートされている各リージョン: 3	不可	自動モデル評価ジョブでデータセットごとに指定できるメトリクスの最大数。これには、カスタムメトリクスと組み込みメトリクスの両方が含まれます。
(評価) ヒューマンワーカーを使用するモデル評価ジョブのモデルの数	サポートされている各リージョン: 2	不可	ヒューマンワーカーを使用するモデル評価ジョブで指定できるモデルの最大数。
(評価) 自動モデル評価ジョブのモデル数	サポートされている各リージョン: 1	[いいえ]	自動モデル評価ジョブで指定できるモデルの最大数。
(評価) カスタムプロンプトデータセットのプロンプトの数	サポートされている各リージョン: 1,000	不可	カスタムプロンプトデータセットに含めることができるプロンプトの最大数。
(評価) プロンプトのサイズ	サポートされている各リージョン: 4	不可	カスタムプロンプトデータセットの個々のプロンプトの最大サイズ (KB)。
(評価) ワーカーのタスク時間	サポートされている各リージョン: 30	不可	ワーカーがタスクを完了するために使える最長時間 (日数)。
(フロー) フローあたりのエージェントノード数	サポートされている各リージョン: 20	不可	エージェントノードの最大数。
(フロー) フローあたりのコレクターノード	サポートされている各リージョン: 1	[いいえ]	コレクターノードの最大数。
(フロー) フローあたりの条件ノード	サポートされている各リージョン：5	不可	条件ノードの最大数。
(フロー) 条件ノードあたりの条件	サポートされている各リージョン：5	不可	条件ノードあたりの条件の最大数。
(フロー) 1 秒あたりの CreateFlow リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateFlow リクエストの最大数。
(フロー) 1 秒あたりの CreateFlowAlias リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateFlowAlias リクエストの最大数。
(フロー) 1 秒あたりの CreateFlowVersion リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateFlowVersion リクエストの最大数。
(フロー) 1 秒あたりの DeleteFlow リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeleteFlow リクエストの最大数。
(フロー) 1 秒あたりの DeleteFlowAlias リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeleteFlowAlias リクエストの最大数。
(フロー) 1 秒あたりの DeleteFlowVersion リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeleteFlowVersion リクエストの最大数。
(フロー) フローあたりのフローエイリアス	サポートされている各リージョン: 10	不可	フローエイリアスの最大数。
(フロー) アカウントあたりのフロー実行数	サポートされている各リージョン: 1,000	あり	フロー実行のアカウントあたりの最大数。
(フロー) フローあたりのフローバージョン	サポートされている各リージョン: 10	不可	フローバージョンの最大数。
(フロー) アカウントあたりのフロー	サポートされている各リージョン: 100	可能	フローのアカウントあたりの最大数
(フロー) 1 秒あたりの GetFlow リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetFlow リクエストの最大数。
(フロー) 1 秒あたりの GetFlowAlias リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetFlowAlias リクエストの最大数。
(フロー) 1 秒あたりの GetFlowVersion リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetFlowVersion リクエストの最大数。
(フロー) フローあたりのインラインコードノード数	サポートされている各リージョン：5	不可	フローあたりのインラインコードノードの最大数。
(フロー) フローあたりの入力ノード数	サポートされている各リージョン: 1	[いいえ]	フロー入力ノードの最大数。
(フロー) フローあたりのイテレーターノード数	サポートされている各リージョン: 1	[いいえ]	イテレーターノードの最大数。
(フロー) フローあたりのナレッジベースノード数	サポートされている各リージョン: 20	不可	ナレッジベースノードの最大数。
(フロー) フローあたりの Lambda 関数ノード数	サポートされている各リージョン: 20	不可	Lambda 関数ノードの最大数。
(フロー) フローあたりの Lex ノード数	サポートされている各リージョン：5	不可	Lex ノードの最大数。
(フロー) 1 秒あたりの ListFlowAliases リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListFlowAliases リクエストの最大数。
(フロー) 1 秒あたりの ListFlowVersions リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListFlowVersions リクエストの最大数。
(フロー) 1 秒あたりの ListFlows リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListFlows リクエストの最大数。
(フロー) フローあたりの出力ノード数	サポートされている各リージョン: 20	不可	フロー出力ノードの最大数。
(フロー) 1 秒あたりの PrepareFlow リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの PrepareFlow リクエストの最大数。
(フロー) フローあたりのプロンプトノード数	サポートされている各リージョン: 20	可能	プロンプトノードの最大数。
(フロー) フローあたりの S3 取得ノード数	サポートされている各リージョン: 10	不可	S3 取得ノードの最大数。
(フロー) フローあたりの S3 ストレージノード数	サポートされている各リージョン: 10	不可	S3 ストレージノードの最大数。
(フロー) フローあたりの合計ノード数	サポートされている各リージョン: 40	不可	フロー内のノードの最大数。
(フロー) 1 秒あたりの UpdateFlow リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの UpdateFlow リクエストの最大数。
(フロー) 1 秒あたりの UpdateFlowAlias リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの UpdateFlowAlias リクエストの最大数。
(フロー) 1 秒あたりの ValidateFlowDefinition リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの ValidateFlowDefinition リクエストの最大数。
(ガードレール) ガードレールあたりの自動推論ポリシー	サポートされている各リージョン: 2	不可	ガードレールあたりの自動推論ポリシーの最大数。
(ガードレール) テキスト単位のコンテキストグラウンディングクエリの長さ	サポートされている各リージョン: 1	[いいえ]	テキスト単位のコンテキストグラウンディングクエリの最大長
(ガードレール) テキスト単位のコンテキストグラウンディングレスポンスの長さ	サポートされている各リージョン：5	不可	テキスト単位のコンテキストグラウンディングレスポンスの最大長
(ガードレール) テキスト単位のコンテキストグラウンディングソースの長さ	us-east-1: 100 us-west-2: 100 他のサポートされている各リージョン: 50	不可	テキスト単位のコンテキストグラウンディングのグラウンディングソースの最大長
(ガードレール) トピックあたりのフレーズの例	サポートされている各リージョン：5	不可	トピックごとに含めることができるトピックの例の最大数
(ガードレール) アカウントあたりのガードレール数	サポートされている各リージョン: 100	不可	アカウント内のガードレールの最大数
(ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25	あり	コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数
(ガードレール) オンデマンド ApplyGuardrail コンテンツフィルターポリシーの 1 秒あたりのテキストユニット数 (標準)	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25	あり	コンテンツフィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは標準コンテンツポリシーモデルに適用されます。
(ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数	us-east-1: 50 us-west-2: 50 他のサポートされている各リージョン: 25	あり	拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数
(ガードレール) オンデマンド ApplyGuardrail 拒否トピックポリシーの 1 秒あたりのテキストユニット数 (標準)	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25	あり	拒否トピックポリシーで処理できる 1 秒あたりのテキストユニットの最大数。これは、標準トピックポリシーモデルに適用されます。
(ガードレール) オンデマンド ApplyGuardrail 機密情報フィルターポリシーの 1 秒あたりのテキストユニット数	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25	あり	機密情報フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数
(ガードレール) オンデマンド ApplyGuardrail 単語フィルターポリシーの 1 秒あたりのテキストユニット数	us-east-1: 200 us-west-2: 200 他のサポートされている各リージョン: 25	あり	単語フィルターポリシーで処理できる 1 秒あたりのテキストユニットの最大数
(ガードレール) オンデマンド ApplyGuardrail コンテキストグラウンディングポリシーの 1 秒あたりのテキストユニット数	サポートされている各リージョン: 106	あり	コンテキストグラウンディングポリシーで処理できる 1 秒あたりのテキストユニットの最大数
(ガードレール) 1 秒あたりのオンデマンド ApplyGuardrail リクエスト数	us-east-1: 50 us-west-2: 50 他のサポートされている各リージョン: 25	あり	1 秒あたりに実行できる ApplyGuardrail API コールの最大数
(ガードレール) 機密情報フィルターの正規表現エンティティ	サポートされている各リージョン: 10	不可	機密情報ポリシーに含めることができるガードレールフィルター正規表現の最大数
(ガードレール) 正規表現の長さ (文字数)	サポートされている各リージョン: 500	不可	ガードレールフィルター正規表現の最大文字数
(ガードレール) ガードレールあたりのトピック	サポートされている各リージョン: 30	不可	ガードレールトピックポリシー間で定義できるトピックの最大数
(ガードレール) ガードレールあたりのバージョン	サポートされている各リージョン: 20	不可	ガードレールで保持できるバージョンの最大数
(ガードレール) 単語の長さ (文字数)	サポートされている各リージョン: 100	不可	ブロックされた単語リスト内の単語の最大長 (文字数)
(ガードレール) 単語ポリシーあたりの単語数	サポートされている各リージョン: 10,000	不可	ブロックされる単語リストに含めることができる単語の最大数
(ナレッジベース) アカウントあたりの IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの同時実行	サポートされている各リージョン: 10	不可	アカウントで同時に実行できる IngestKnowledgeBaseDocuments リクエストと DeleteKnowledgeBaseDocuments リクエストの最大数。
(ナレッジベース) アカウントあたりの同時取り込みジョブ	サポートされている各リージョン：5	不可	アカウントで同時に実行できる取り込みジョブの最大数。
(ナレッジベース) データソースあたりの同時取り込みジョブ	サポートされている各リージョン: 1	[いいえ]	データソースに対して同時に実行できる取り込みジョブの最大数。
(ナレッジベース) ナレッジベースあたりの同時取り込みジョブ	サポートされている各リージョン: 1	[いいえ]	ナレッジベースに対して同時に実行できる取り込みジョブの最大数。
(ナレッジベース) 1 秒あたりの CreateDataSource リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateDataSource API リクエストの最大数。
(ナレッジベース) 1 秒あたりの CreateKnowledgeBase リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateKnowledgeBase API リクエストの最大数。
(ナレッジベース) ナレッジベースあたりのデータソース	サポートされている各リージョン：5	不可	ナレッジベースあたりのデータソースの最大数。
(ナレッジベース) 1 秒あたりの DeleteDataSource リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeleteDataSource API リクエストの最大数。
(ナレッジベース) 1 秒あたりの DeleteKnowledgeBase リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeleteKnowledgeBase API リクエストの最大数。
(ナレッジベース) 1 秒あたりの DeleteKnowledgeBaseDocuments リクエスト数	サポートされている各リージョン：5	不可	1 秒あたりの DeleteKnowledgeBaseDocuments API リクエストの最大数。
(ナレッジベース) 取り込みジョブごとに追加または更新するファイル	サポートされている各リージョン: 5,000,000	不可	取り込みジョブごとに取り込み可能な新規および更新されたファイルの最大数。
(ナレッジベース) 取り込みジョブごとに削除するファイル	サポートされている各リージョン: 5,000,000	不可	取り込みジョブごとに削除できるファイルの最大数。
(ナレッジベース) IngestKnowledgeBaseDocuments ジョブごとに取り込むファイル。	サポートされている各リージョン: 25	不可	IngestKnowledgeBaseDocuments リクエストごとに取り込み可能なドキュメントの最大数。
(ナレッジベース) 1 秒あたりの GenerateQuery リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの GenerateQuery API リクエストの最大数。
(ナレッジベース) 1 秒あたりの GetDataSource リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetDataSource API リクエストの最大数。
(ナレッジベース) 1 秒あたりの GetIngestionJob リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetIngestionJob API リクエストの最大数。
(ナレッジベース) 1 秒あたりの GetKnowledgeBase リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetKnowledgeBase API リクエストの最大数。
(ナレッジベース) 1 秒あたりの GetKnowledgeBaseDocuments リクエスト数	サポートされている各リージョン：5	不可	1 秒あたりの GetKnowledgeBaseDocuments API リクエストの最大数。
(ナレッジベース) 1 秒あたりの IngestKnowledgeBaseDocuments リクエスト数	サポートされている各リージョン：5	不可	1 秒あたりの IngestKnowledgeBaseDocuments API リクエストの最大数。
(ナレッジベース) IngestKnowledgeBaseDocuments の合計ペイロードサイズ	サポートされている各リージョン: 6	不可	IngestKnowledgeBaseDocuments リクエストの合計ペイロードの最大サイズ (MB)。
(ナレッジベース) 取り込みジョブのファイルサイズ	サポートされている各リージョン: 50	不可	取り込みジョブ内のファイルの最大サイズ (MB)。
(ナレッジベース) 取り込みジョブのサイズ	サポートされている各リージョン: 100	不可	取り込みジョブの最大サイズ (GB)。
(ナレッジベース) アカウントあたりのナレッジベース数	サポートされている各リージョン: 100	不可	アカウントあたりのナレッジベースの最大数。
(ナレッジベース) 1 秒あたりの ListDataSources リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListDataSources API リクエストの最大数。
(ナレッジベース) 1 秒あたりの ListIngestionJobs リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListIngestionJobs API リクエストの最大数。
(ナレッジベース) 1 秒あたりの ListKnowledgeBaseDocuments リクエスト数	サポートされている各リージョン：5	不可	1 秒あたりの ListKnowledgeBaseDocuments API リクエストの最大数。
(ナレッジベース) 1 秒あたりの ListKnowledgeBases リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListKnowledgeBases API リクエストの最大数。
(ナレッジベース) BDA パーサーのファイルの最大数	サポートされている各リージョン: 1,000	不可	Amazon Bedrock Data Automation をパーサーとして使用できるファイルの最大数。
(ナレッジベース) パーサーとしての基盤モデルのファイルの最大数	サポートされている各リージョン: 1,000	不可	基盤モデルをパーサーとして使用できるファイルの最大数。
(ナレッジベース) 1 秒あたりの Rerank リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの Rerank API リクエストの最大数。
(ナレッジベース) 1 秒あたりの Retrieve リクエスト数	サポートされている各リージョン: 20	不可	1 秒あたりの Retrieve API リクエストの最大数。
(ナレッジベース) 1 秒あたりの RetrieveAndGenerate リクエスト数	サポートされている各リージョン: 20	不可	1 秒あたりの RetrieveAndGenerate API リクエストの最大数。
(ナレッジベース) 1 秒あたりの RetrieveAndGenerateStream リクエスト数	サポートされている各リージョン: 20	不可	1 秒あたりの RetrieveAndGenerateStream API リクエストの最大数。
(ナレッジベース) 1 秒あたりの StartIngestionJob リクエスト数	サポートされている各リージョン: 0.1	不可	1 秒あたりの StartIngestionJob API リクエストの最大数。
(ナレッジベース) 1 秒あたりの UpdateDataSource リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの UpdateDataSource API のリクエストの最大数。
(ナレッジベース) 1 秒あたりの UpdateKnowledgeBase リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの UpdateKnowledgeBase API リクエストの最大数。
(ナレッジベース) ユーザークエリサイズ	サポートされている各リージョン: 1,000	不可	ユーザークエリの最大サイズ (文字数)。
(モデルのカスタマイズ) アカウントあたりのカスタムモデル	サポートされている各リージョン: 100	可能	アカウントのカスタムモデルの最大数。
(モデルのカスタマイズ) 進行中のカスタムモデルのデプロイ	サポートされている各リージョン: 2	あり	進行中のカスタムモデルのデプロイの最大数
(モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大入力ファイルサイズ	サポートされている各リージョン: 2 GB	不可	カスタマイズ蒸留ジョブの最大入力ファイルサイズ。
(モデルのカスタマイズ) カスタマイズ蒸留ジョブの最大行長	サポートされている各リージョン: 16 キロバイト	不可	カスタマイズ蒸留ジョブの入力ファイルの最大行長。
(モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最大数	サポートされている各リージョン: 15,000	不可	カスタマイズ蒸留ジョブに必要なプロンプトの最大数。
(モデルのカスタマイズ) Amazon Nova Canvas ファインチューニングジョブのトレーニングレコードの最大数	サポートされている各リージョン: 10,000	あり	Amazon Nova Canvas ファインチューニングジョブで許可されるレコードの最大数。
(モデルのカスタマイズ) Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長	サポートされている各リージョン: 32,000	不可	Amazon Nova Micro V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。
(モデルのカスタマイズ) Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長	サポートされている各リージョン: 32,000	不可	Amazon Nova V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。
(モデルのカスタマイズ) Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長	サポートされている各リージョン: 32,000	不可	Anthropic Claude 3 haiku 20240307 V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。
(モデルのカスタマイズ) Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長	サポートされている各リージョン: 16,000	不可	Llama 3.1 70B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。
(モデルのカスタマイズ) Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長	サポートされている各リージョン: 32,000	不可	Llama 3.1 8B Instruct V1 カスタマイズ蒸留ジョブの生徒モデルのファインチューニングコンテキストの最大長。
(モデルのカスタマイズ) カスタマイズ蒸留ジョブのプロンプトの最小数	サポートされている各リージョン: 100	不可	カスタマイズ蒸留ジョブに必要なプロンプトの最小数。
(モデルのカスタマイズ) スケジュールされたカスタマイズジョブ	サポートされている各リージョン: 10	不可	スケジュールされたカスタマイズジョブの最大数。
(モデルカスタマイズ) Amazon Nova 2 Lite の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計	サポートされている各リージョン: 2,000	不可	Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの入出力の合計
(モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計	サポートされている各リージョン: 2,000	不可	Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計
(モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計	サポートされている各リージョン: 2,000	不可	Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計
(モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計	サポートされている各リージョン: 200	不可	Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計
(モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイリクエストの合計	サポートされている各リージョン: 400	不可	Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイリクエストの合計
(モデルカスタマイズ) Amazon Nova 2 Lite の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 5,760,000,000	不可	Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Lite の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 5,760,000,000	不可	Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Micro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 5,760,000,000	不可	Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Pro の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 1,152,000,000	不可	Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 日あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 432,000,000	不可	Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 日あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルカスタマイズ) Amazon Nova 2 Lite の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 4,000,000	不可	Amazon Nova 2 Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Lite の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 4,000,000	不可	Amazon Nova Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Micro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 4,000,000	不可	Amazon Nova Micro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova Pro の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 800,000	不可	Amazon Nova Pro の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドカスタムモデルデプロイトークンの合計	サポートされている各リージョン: 300,000	不可	Meta Llama 3.3 70B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションに送信された 1 分あたりの入出力オンデマンドカスタムモデルデプロイトークンの合計
(モデルのカスタマイズ) Amazon Nova 2 Lite ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 20,000	あり	Amazon Nova 2 Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの合計最大数。
(モデルのカスタマイズ) Amazon Nova Lite ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 20,000	あり	Amazon Nova Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Amazon Nova Micro ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 20,000	あり	Amazon Nova Micro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Amazon Nova Pro ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 20,000	あり	Amazon Nova Pro ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Claude 3 Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Claude 3 Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Claude 3-5-Haiku v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Claude 3-5-Haiku ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 2 13B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 2 13B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 2 70B v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 2 70B ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.1 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.1 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.1 8B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.1 8B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.2 11B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.2 11B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.2 1B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.2 1B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.2 3B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.2 3B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.2 90B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.2 90B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Meta Llama 3.3 70B Instruct v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Meta Llama 3.3 70B Instruct ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Image Generator G1 V1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Titan Image Generator ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Image Generator G1 V2 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Titan Image Generator V2 ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Multimodal Embeddings G1 v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン：50,000	あり	Titan Multimodal Embeddings ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Text G1 – Express v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 100,000	あり	Titan Text Express の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Text G1 – Express v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Titan Text Express ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Text G1 – Lite v1 の継続的な事前トレーニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 100,000	あり	Titan Text Lite の継続的な事前トレーニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Text G1 – Lite v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 10,000	あり	Titan Text Lite ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) Titan Text G1 – Premier v1 ファインチューニングジョブのトレーニングレコードと検証レコードの合計	サポートされている各リージョン: 20,000	あり	Titan Text Premier ファインチューニングジョブで許可されるトレーニングレコードと検証レコードの最大合計数。
(モデルのカスタマイズ) カスタムモデルのデプロイの合計数	サポートされている各リージョン: 10	あり	カスタムモデルのデプロイの合計数
(プロンプト管理) 1 秒あたりの CreatePrompt リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreatePrompt リクエストの最大数。
(プロンプト管理) 1 秒あたりの CreatePromptVersion リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreatePromptVersion リクエストの最大数。
(プロンプト管理) 1 秒あたりの DeletePrompt リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの DeletePrompt リクエストの最大数。
(プロンプト管理) 1 秒あたりの GetPrompt リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの GetPrompt リクエストの最大数。
(プロンプト管理) 1 秒あたりの ListPrompts リクエスト数	サポートされている各リージョン: 10	不可	1 秒あたりの ListPrompts リクエストの最大数。
(プロンプト管理) アカウントあたりのプロンプト	サポートされている各リージョン: 500	あり	プロンプトの最大数。
(プロンプト管理) 1 秒あたりの UpdatePrompt リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの UpdatePrompt リクエストの最大数。
(プロンプト管理) プロンプトあたりのバージョン	サポートされている各リージョン: 10	不可	プロンプトあたりのバージョンの最大数。
エージェントあたりの API	サポートされている各リージョン: 11	あり	エージェントに追加できる API の最大数。
エージェントあたりのアクショングループ	サポートされている各リージョン: 20	可能	エージェントに追加できるアクショングループの最大数。
エージェントあたりのエージェントコラボレーター	サポートされている各リージョン: 1,000	あり	エージェントに追加できるコラボレーターエージェントの最大数。
アカウントあたりのエージェント	サポートされている各リージョン: 1,000	あり	1 つのアカウントのエージェントの最大数。
1 秒あたりの AssociateAgentKnowledgeBase リクエスト数	サポートされている各リージョン: 6	不可	1 秒あたりの AssociateAgentKnowledgeBase API リクエストの最大数。
エージェントあたりの関連付けられたエイリアス	サポートされている各リージョン: 10	不可	エージェントに関連付けられるエイリアスの最大数。
エージェントあたりの関連付けられたナレッジベース	サポートされている各リージョン: 2	あり	エージェントに関連付けられるナレッジベースの最大数。
Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Amazon Nova Premier のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Amazon Nova Premier のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3 Haiku のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3 Opus のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3 Opus のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3 Sonnet のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3.5 Haiku のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3.5 Haiku のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3.5 Sonnet のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3.5 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3.5 Sonnet v2 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude 3.5 Sonnet v2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude 3.7 Sonnet のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	あり	Claude 3.7 Sonnet のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Claude Haiku 4.5 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude Haiku 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Claude Opus 4.5 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude Opus 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Claude Opus 4.6 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Claude Opus 4.6 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Claude Sonnet 4 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	あり	Claude Sonnet 4 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。
Claude Sonnet 4.5 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Claude Sonnet 4.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Claude Sonnet 4.6 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Claude Sonnet 4.6 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
DeepSeek V3.2 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	DeepSeek V3.2 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
DeepSeek v3 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	DeepSeek v3 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Devstral 2 123B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Devstral 2 123B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
GLM 4.7 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	GLM 4.7 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
GLM 4.7 Flash のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	GLM 4.7 Flash のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Gemma 3 12B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Gemma 3 12B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Gemma 3 27B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Gemma 3 27B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Gemma 3 4B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Gemma 3 4B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Kimi K2 thinking のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Kimi K2 thinking のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Kimi K2.5 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Kimi K2.5 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Llama 3.1 405B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.1 405B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.1 70B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.1 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.1 8B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.1 8B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.2 11B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.2 11B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.2 1B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.2 1B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.2 3B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.2 3B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.2 90B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.2 90B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 3.3 70B Instruct のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 3.3 70B Instruct のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 4 Maverick のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 4 Maverick のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Llama 4 Scout のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Llama 4 Scout のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Magistral Small 2509 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Magistral Small 2509 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
MiniMax M2 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	MiniMax M2 のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。
MiniMax M2.1 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	MiniMax M2.1 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Ministral 3 14B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Ministral 3 14B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Ministral 3 8B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Ministral 3 8B のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。
Ministral 3B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Ministral 3B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Mistral Large 2 (24.07) のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Mistral Large 2 (24.07) のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。
Mistral Large 3 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Mistral Large 3 のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。
Mistral Small のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Mistral Small のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。
NVIDIA Nemotron Nano 12B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	NVIDIA Nemotron Nano 12B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
NVIDIA Nemotron Nano 3 30B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	NVIDIA Nemotron Nano 3 30B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
NVIDIA Nemotron Nano 9B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	NVIDIA Nemotron Nano 9B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Nova 2 Lite のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Nova 2 Lite のバッチ推論に送信された 1 つのファイルの最大サイズ (GB 単位）。
Nova Lite V1 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Nova Lite V1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。
Nova Micro V1 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Nova Micro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Nova Pro V1 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Nova Pro V1 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
OpenAI GPT OSS 120b のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	OpenAI GPT OSS 120b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
OpenAI GPT OSS 20b のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	OpenAI GPT OSS 20b のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
OpenAI GPT OSS Safeguard 120b のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	OpenAI GPT OSS Safeguard 120b のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
OpenAI GPT OSS Safeguard 20b のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	OpenAI GPT OSS Safeguard 20b のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Qwen3 235B のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Qwen3 235B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Qwen3 32B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Qwen3 32B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Qwen3 Coder 30B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Qwen3 Coder 30B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Qwen3 Coder 480B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Qwen3 Coder 480B のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Qwen3 Coder Next のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Qwen3 Coder Next のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Qwen3 Next 80B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Qwen3 Next 80B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Qwen3 VL 235B のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Qwen3 VL 235B のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Titan Multimodal Embeddings G1 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Titan Multimodal Embeddings G1 のバッチ推論に送信される 1 つのファイルの最大サイズ (GB)。
Titan Text Embeddings V2 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Titan Text Embeddings V2 のバッチ推論用に送信される 1 つのファイルの最大サイズ (GB)。
Voxtral Mini 3B 2507 のバッチ推論入力ファイルサイズ (GB 単位)	サポートされている各リージョン: 1	[いいえ]	Voxtral Mini 3B 2507 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Voxtral Small 24B 2507 のバッチ推論入力ファイルサイズ (GB)	サポートされている各リージョン: 1	[いいえ]	Voxtral Small 24B 2507 のバッチ推論用に送信された 1 つのファイルの最大サイズ (GB 単位）。
Qwen3 Next 80B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 Next 80B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン: 100	不可	Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Amazon Nova Premier のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Amazon Nova Premier のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3 Haiku のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3 Opus のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3 Opus のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3 Sonnet のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3.5 Haiku のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3.5 Haiku のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3.5 Sonnet のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3.5 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3.5 Sonnet v2 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude 3.5 Sonnet v2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude 3.7 Sonnet のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン： 5	あり	Claude 3.7 Sonnet のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude Haiku 4.5 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude Haiku 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Claude Opus 4.5 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude Opus 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Claude Opus 4.6 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Claude Opus 4.6 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Claude Sonnet 4 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン： 5	あり	Claude Sonnet 4 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Claude Sonnet 4.5 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Claude Sonnet 4.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Claude Sonnet 4.6 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Claude Sonnet 4.6 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
DeepSeek V3.2 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	DeepSeek V3.2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
DeepSeek v3 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	DeepSeek v3 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Devstral 2 123B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Devstral 2 123B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
GLM 4.7 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	GLM 4.7 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
GLM 4.7 Flash のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	GLM 4.7 Flash のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Gemma 3 12B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Gemma 3 12B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Gemma 3 27B のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Gemma 3 27B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Gemma 3 4B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Gemma 3 4B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Kimi K2 thinking のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Kimi K2 Think のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Kimi K2.5 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Kimi K2.5 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Llama 3.1 405B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.1 405B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.1 70B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.1 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.1 8B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.1 8B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.2 11B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.2 11B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.2 1B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.2 1B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.2 3B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.2 3B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.2 90B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.2 90B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 3.3 70B Instruct のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 3.3 70B Instruct のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 4 Maverick のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 4 Maverick のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Llama 4 Scout のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Llama 4 Scout のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Magistral Small 2509 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Magistral Small 2509 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
MiniMax M2 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	MiniMax M2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
MiniMax M2.1 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	MiniMax M2.1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Ministral 3 14B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Ministral 3 14B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Ministral 3 8B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Ministral 3 8B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Ministral 3B のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Ministral 3B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Mistral Large 2 (24.07) のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Mistral Large 2 (24.07) のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Mistral Large 3 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Mistral Large 3 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Mistral Small のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Mistral Small のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
NVIDIA Nemotron Nano 12B のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	NVIDIA Nemotron Nano 12B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
NVIDIA Nemotron Nano 9B のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	NVIDIA Nemotron Nano 9B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Nova Lite V1 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Nova Lite V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Nova Micro V1 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Nova Micro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Nova Pro V1 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン: 100	不可	Nova Pro V1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
OpenAI GPT OSS 120b のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	OpenAI GPT OSS 120b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
OpenAI GPT OSS 20b のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	OpenAI GPT OSS 20b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Qwen3 235B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 235B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Qwen3 32B のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Qwen3 32B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Qwen3 Coder 30B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 Coder 30B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Qwen3 Coder 480B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 Coder 480B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Qwen3 Coder Next のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 Coder Next のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Qwen3 VL 235B のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Qwen3 VL 235B のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Titan Multimodal Embeddings G1 のバッチ推論ジョブサイズ (GB)	サポートされている各リージョン：5	不可	Titan Multimodal Embeddings G1 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Titan Text Embeddings V2 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Titan Text Embeddings V2 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB)。
Voxtral Mini 3B 2507 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Voxtral Mini 3B 2507 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
Voxtral Small 24B 2507 のバッチ推論ジョブサイズ (GB 単位)	サポートされている各リージョン：5	不可	Voxtral Small 24B 2507 のバッチ推論ジョブに含まれるすべての入力ファイルの最大累積サイズ (GB 単位）。
エージェント指示の文字	サポートされている各リージョン: 20,000	不可	エージェントに対する指示の最大文字数。
同時モデルインポートジョブ	サポートされている各リージョン: 1	[いいえ]	同時進行中のモデルインポートジョブの最大数。
1 秒あたりの CreateAgent リクエスト数	サポートされている各リージョン: 6	不可	1 秒あたりの CreateAgent API リクエストの最大数。
1 秒あたりの CreateAgentActionGroup リクエスト数	サポートされている各リージョン: 12	不可	1 秒あたりの CreateAgentActionGroup API リクエストの最大数。
1 秒あたりの CreateAgentAlias リクエスト数	サポートされている各リージョン: 2	不可	1 秒あたりの CreateAgentAlias API リクエストの最大数。
Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	InvokeModel と InvokeModelWithResponseStream を 1 分間に呼び出すことができる最大回数。クォータには、Anthropic Claude 3.5 Haiku の InvokeModel トークンと InvokeModelWithResponseStream トークンの合計が考慮されます。
Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-west-2: 500 他のサポートされている各リージョン: 100	不可	Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 4,000,000	あり	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのクロスリージョンモデル推論トークン数	us-west-2: 4,000,000 サポートされている他の各リージョン: 800,000	あり	Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova 2 Lite のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 2,000	不可	Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Omni のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 2,000	不可	Amazon Nova 2 Omni のモデル推論に 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Pro Preview のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 100	不可	Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-east-1: 4,000 us-east-2: 4,000 us-west-1: 4,000 us-west-2: 4,000 サポートされている他の各リージョン: 400	不可	Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-east-1: 4,000 us-east-2: 4,000 us-west-2: 4,000 サポートされている他の各リージョン: 400	不可	Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 500	不可	Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 500	不可	Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-east-1: 2,000 us-west-2: 2,000 ap-northeast-1: 400 ap-southeast-1: 400 他のサポートされている各リージョン: 800	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 100	不可	Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-east-1: 1,000 us-west-2: 1,000 他のサポートされている各リージョン: 200	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-west-2: 500 ap-northeast-1: 40 ap-southeast-1: 40 eu-central-1: 40 eu-west-1: 40 eu-west-3: 40 他のサポートされている各リージョン: 100	不可	Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	us-east-1: 250 us-east-2: 250 us-west-2: 250 eu-central-1: 100 eu-north-1: 100 eu-west-1: 100 eu-west-3: 100 他のサポートされている各リージョン: 50	不可	Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,000	あり	Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 200	不可	Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 50	不可	Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.5 のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.6 V1 のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.6 V1 1M コンテキスト長のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン： 5	あり	Anthropic Claude Opus 4.6 V1 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 200	あり	Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン： 5	あり	Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,000	あり	Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン： 5	あり	Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.6 のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 10,000	あり	Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.6 1M 万コンテキスト長のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	Anthropic Claude Sonnet 4.6 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 200	不可	DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,600	不可	Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,600	不可	Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,600	不可	Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。
Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Conservative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 4	不可	Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Control Sketch の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Control Sketch でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Control Structure の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Control Structure でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Creative Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 4	不可	Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Erase Object の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Erase Object でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Fast Upscale の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Inpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Inpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Outpaint の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 4	不可	Stable Image Outpaint でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Remove Background の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Remove Background でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Search and Recolor の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Search and Replace の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Search and Replace でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Style Guide の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Style Guide でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Style Transfer の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 20	不可	Stable Image Style Transfer でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Twelve Labs Marengo の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 200	不可	Twelve Labs Marengo でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Twelve Labs Pegasus の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 120	あり	Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
TwelveLabs Marengo Embed 3.0 のクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 1,000	あり	TwelveLabs Marengo Embed 3.0 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Lite のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 8,000,000	あり	Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Omni のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 8,000,000	あり	Amazon Nova 2 Omni のモデル推論に 1 分で送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Pro Preview のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Lite の 1 分あたりのクロスリージョンモデル推論トークン数	us-east-1: 8,000,000 us-east-2: 8,000,000 us-west-1: 8,000,000 us-west-2: 8,000,000 サポートされている他の各リージョン: 400,000	あり	Amazon Nova Lite でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Micro の 1 分あたりのクロスリージョンモデル推論トークン数	us-east-1: 8,000,000 us-east-2: 8,000,000 us-west-2: 8,000,000 サポートされている他の各リージョン: 400,000	あり	Amazon Nova Micro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Premier V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 2,000,000	あり	Amazon Nova Premier V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Pro の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 2,000,000	あり	Amazon Nova Pro でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Haiku の 1 分あたりのクロスリージョンモデル推論トークン数	us-east-1: 4,000,000 us-west-2: 4,000,000 ap-northeast-1: 400,000 ap-southeast-1: 400,000 サポートされている他の各リージョン: 600,000	あり	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Opus の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 800,000	あり	Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数	us-east-1: 2,000,000 us-west-2: 2,000,000 サポートされている他の各リージョン: 400,000	あり	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3.5 Sonnet の 1 分あたりのクロスリージョンモデル推論トークン数	us-west-2: 4,000,000 ap-northeast-1: 400,000 ap-southeast-1: 400,000 eu-central-1: 400,000 eu-west-1: 400,000 eu-west-3: 400,000 サポートされている他の各リージョン: 800,000	あり	Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのクロスリージョンモデル推論トークン数	us-east-1: 1,000,000 us-east-2: 1,000,000 us-west-2: 1,000,000 eu-central-1: 100,000 eu-north-1: 100,000 eu-west-1: 100,000 eu-west-3: 100,000 サポートされている他の各リージョン: 50,000	あり	Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Haiku 4.5 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 200,000	あり	Anthropic Claude Opus 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 500,000	あり	Anthropic Claude Opus 4.1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.5 のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 2,000,000	あり	Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 2,000,000	あり	Anthropic Claude Opus 4.6 V1 のモデル推論に 1 分で送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 1M コンテキスト長のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Opus 4.6 V1 1M Context Length のモデル推論に 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 200,000	あり	Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Sonnet 4 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 1M コンテキスト長のクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Sonnet 4.6 1M Context Length のモデル推論に 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Embed V4 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 300,000	あり	Cohere Embed V4 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
DeepSeek R1 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 200,000	あり	DeepSeek R1 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 405B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 800,000	あり	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 8B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.2 1B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.2 3B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。
Meta Llama 3.3 70B Instruct の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 4 Maverick V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 4 Maverick V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 4 Scout V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 600,000	あり	Meta Llama 4 Scout V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral Pixtral Large 25.02 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 80,000	あり	Mistral Pixtral Large 25.02 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Writer AI Palmyra X4 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 150,000	あり	Writer AI Palmyra X4 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Writer AI Palmyra X5 V1 の 1 分あたりのクロスリージョンモデル推論トークン数	サポートされている各リージョン: 150,000	あり	Writer AI Palmyra X5 V1 でモデル推論のために 1 分間に送信できるクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
アカウントあたりの作成中ステータスのカスタムモデル	サポートされている各リージョン: 2	あり	作成中ステータスのカスタムモデルの最大数。
1 秒あたりの DeleteAgent リクエスト数	サポートされている各リージョン: 2	不可	DeleteAgent API リクエストの 1 秒あたりの最大数。
1 秒あたりの DeleteAgentActionGroup リクエスト数	サポートされている各リージョン: 2	不可	DeleteAgentActionGroup API リクエストの 1 秒あたりの最大数。
1 秒あたりの DeleteAgentAlias リクエスト数	サポートされている各リージョン: 2	不可	DeleteAgentAlias API リクエストの 1 秒あたりの最大数。
1 秒あたりの DeleteAgentVersion リクエスト数	サポートされている各リージョン: 2	不可	DeleteAgentVersion API リクエストの 1 秒あたりの最大数。
1 秒あたりの DisassociateAgentKnowledgeBase リクエスト数	サポートされている各リージョン: 4	不可	DisassociateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。
エージェントあたりの有効アクショングループ数	サポートされている各リージョン: 15	可能	エージェントで有効にできるアクショングループの最大数。
推論プロファイルあたりのエンドポイント数	サポートされている各リージョン：5	不可	推論プロファイル内のエンドポイントの最大数。エンドポイントは、モデルと、モデルへの呼び出しリクエストの送信先のリージョンによって定義されます。
1 秒あたりの GetAgent リクエスト数	サポートされている各リージョン: 15	不可	GetAgent API リクエストの 1 秒あたりの最大数。
1 秒あたりの GetAgentActionGroup リクエスト数	サポートされている各リージョン: 20	不可	GetAgentActionGroup API リクエストの 1 秒あたりの最大数。
1 秒あたりの GetAgentAlias リクエスト数	サポートされている各リージョン: 10	不可	GetAgentAlias API リクエストの 1 秒あたりの最大数。
1 秒あたりの GetAgentKnowledgeBase リクエスト数	サポートされている各リージョン: 15	不可	GetAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。
1 秒あたりの GetAgentVersion リクエスト数	サポートされている各リージョン: 10	不可	GetAgentVersion API リクエストの 1 秒あたりの最大数。
Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 2,000	あり	Amazon Nova 2 Lite でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 2,000	あり	Amazon Nova 2 Omni でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 100	可能	Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,000	あり	Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Opus 4.6 V1 1M Context Length のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン： 5	あり	Anthropic Claude Opus 4.6 V1 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 200	あり	Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 1,000	あり	Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数	サポートされている各リージョン： 5	あり	Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論リクエスト/分	サポートされている各リージョン: 10,000	あり	Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Sonnet 4.6 1M 万コンテキスト長に対する 1 分あたりのグローバルクロスリージョンモデル推論リクエスト	サポートされている各リージョン: 500	あり	Anthropic Claude Sonnet 4.6 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論リクエスト数	サポートされている各リージョン: 2,000	あり	Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョンリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論トークン/日	サポートされている各リージョン: 11,520,000,000	不可	Amazon Nova 2 Lite のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論トークン/日	サポートされている各リージョン: 11,520,000,000	不可	Amazon Nova 2 Omni のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論トークン/日	サポートされている各リージョン: 1,440,000,000	不可	Amazon Nova 2 Pro Preview のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Haiku 4.5 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 7,200,000,000	不可	Anthropic Claude Haiku 4.5 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論トークン	サポートされている各リージョン: 2,880,000,000	不可	Anthropic Claude Opus 4.5 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論トークン	サポートされている各リージョン: 2,880,000,000	不可	Anthropic Claude Opus 4.6 V1 のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 1M Context Length のグローバルクロスリージョンモデル推論トークン	サポートされている各リージョン: 1,440,000,000	不可	Anthropic Claude Opus 4.6 V1 1M Context Length のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 288,000,000	不可	Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 7,200,000,000	不可	Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 1,440,000,000	不可	Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論トークン	サポートされている各リージョン: 7,200,000,000	不可	Anthropic Claude Sonnet 4.6 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 1M Context Length のグローバルクロスリージョンモデル推論トークン	サポートされている各リージョン: 1,440,000,000	不可	Anthropic Claude Sonnet 4.6 1M Context Length のモデル推論に 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Embed V4 の 1 日あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 432,000,000	不可	Cohere Embed V4 でモデル推論のために 1 日に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Lite のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 8,000,000	あり	Amazon Nova 2 Lite のモデル推論に 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Omni のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 8,000,000	あり	Amazon Nova 2 Omni のモデル推論に 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Pro Preview のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Amazon Nova 2 Pro Preview でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Haiku 4.5 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Haiku 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.5 のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 2,000,000	あり	Anthropic Claude Opus 4.5 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 2,000,000	あり	Anthropic Claude Opus 4.6 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Opus 4.6 V1 1M コンテキスト長のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Opus 4.6 V1 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 200,000	あり	Anthropic Claude Sonnet 4 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Sonnet 4.5 V1 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 分あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Sonnet 4.5 V1 1M Context Length でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 5,000,000	あり	Anthropic Claude Sonnet 4.6 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Sonnet 4.6 1M0 万コンテキスト長のグローバルクロスリージョンモデル推論トークン/分	サポートされている各リージョン: 1,000,000	あり	Anthropic Claude Sonnet 4.6 1M コンテキストの長さについて、モデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Embed V4 の 1 分あたりのグローバルクロスリージョンモデル推論トークン数	サポートされている各リージョン: 300,000	あり	Cohere Embed V4 でモデル推論のために 1 分間に送信できるグローバルクロスリージョントークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
アカウントあたりのインポート済みモデル数	サポートされている各リージョン: 3	あり	アカウント内のインポート済みモデルの最大数。
アカウントあたりの推論プロファイル数	サポートされている各リージョン: 1,000	あり	アカウント内の推論プロファイルの最大数。
1 秒あたりの ListAgentActionGroups リクエスト数	サポートされている各リージョン: 10	不可	ListAgentActionGroups API リクエストの 1 秒あたりの最大数。
1 秒あたりの ListAgentAliases リクエスト数	サポートされている各リージョン: 10	不可	ListAgentAliases API リクエストの 1 秒あたりの最大数。
1 秒あたりの ListAgentKnowledgeBases リクエスト数	サポートされている各リージョン: 10	不可	ListAgentKnowledgeBases API リクエストの 1 秒あたりの最大数。
1 秒あたりの ListAgentVersions リクエスト数	サポートされている各リージョン: 10	不可	ListAgentVersions API リクエストの 1 秒あたりの最大数。
1 秒あたりの ListAgents リクエスト数	サポートされている各リージョン: 10	不可	ListAgents API リクエストの 1 秒あたりの最大数。
Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Amazon Nova Premier のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3 Haiku のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3 Opus のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3 Sonnet のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3.5 Haiku のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	可能	Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Haiku 4.5 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude Haiku 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Opus 4.5 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude Opus 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Opus 4.6 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude Opus 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Sonnet 4 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	可能	Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Sonnet 4.5 のバッチ推論ジョブあたりのレコードの最小数。	サポートされている各リージョン: 100	不可	Claude Sonnet 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Claude Sonnet 4.6 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Claude Sonnet 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
DeepSeek V3.2 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	DeepSeek V3.2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
DeepSeek v3 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Devstral 2 123B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Devstral 2 123B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
GLM 4.7 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	GLM 4.7 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
GLM 4.7 Flash のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	GLM 4.7 Flash のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Gemma 3 12B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Gemma 3 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Gemma 3 27B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Gemma 3 27B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Gemma 3 4B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Gemma 3 4B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Kimi K2 thinking のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Kimi K2 thinking のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Kimi K2.5 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Kimi K2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 4 Maverick のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Llama 4 Scout のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Magistral Small 2509 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Magistral Small 2509 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
MiniMax M2 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	MiniMax M2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
MiniMax M2.1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	MiniMax M2.1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Ministral 3 14B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Ministral 3 14B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Ministral 3 8B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Ministral 3 8B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Ministral 3B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Ministral 3B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Mistral Large 3 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Mistral Large 3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Mistral Small のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	NVIDIA Nemotron Nano 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	NVIDIA Nemotron Nano 9B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Nova 2 Lite のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Nova 2 Lite のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Nova Lite V1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Nova Micro V1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Nova Pro V1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 235B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 32B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 Coder 30B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 Coder 480B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 Coder Next のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 Coder Next のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 Next 80B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 Next 80B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Qwen3 VL 235B のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Qwen3 VL 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Voxtral Mini 3B 2507 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Voxtral Mini 3B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Voxtral Small 24B 2507 のバッチ推論ジョブあたりのレコードの最小数	サポートされている各リージョン: 100	不可	Voxtral Small 24B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最小数。
Amazon Nova Pro V1 の 1 日あたりのモデル呼び出しの最大レイテンシー最適化トークン	サポートされている各リージョン: 57,600,000	不可	Amazon Nova Pro V1 のレイテンシー最適化モデル推論に 1 日に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Lite の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 5,760,000,000	不可	Amazon Nova 2 Lite のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Amazon Nova 2 Omni の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 5,760,000,000	不可	Amazon Nova 2 Omni のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Amazon Nova 2 Pro Preview の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 720,000,000	不可	Amazon Nova 2 Pro Preview のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Amazon Nova Premier V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 1,440,000,000	不可	Amazon Nova Premier V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude 3 Haiku の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	us-east-1: 2,880,000,000 us-west-2: 2,880,000,000 ap-northeast-1: 288,000,000 ap-southeast-1: 288,000,000 サポートされている他の各リージョン: 432,000,000	不可	Anthropic Claude 3 Haiku のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude 3.5 Haiku の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 2,880,000,000	不可	Anthropic Claude 3.5 Haiku のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude 3.5 Sonnet V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 2,880,000,000	不可	Anthropic Claude 3.5 Sonnet V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude 3.5 Sonnet V2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	us-east-1: 2,880,000,000 us-west-2: 2,880,000,000 サポートされている他の各リージョン: 576,000,000	不可	Anthropic Claude 3.5 Sonnet V2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude 3.7 Sonnet V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 720,000,000	不可	Anthropic Claude 3.7 Sonnet V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Haiku 4.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 3,600,000,000	不可	Anthropic Claude Haiku 4.5 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Opus 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000	不可	Anthropic Claude Opus 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Opus 4.1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 360,000,000	不可	Anthropic Claude Opus 4.1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Opus 4.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 1,440,000,000	不可	Anthropic Claude Opus 4.5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Opus 4.6 の 1M日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 720,000,000	不可	Anthropic Claude Opus 4.6 1M コンテキスト長のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Opus 4.6 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 1,440,000,000	不可	Anthropic Claude Opus 4.6 V1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Sonnet 4 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000	不可	Anthropic Claude Sonnet 4 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Sonnet 4 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 720,000,000	不可	Anthropic Claude Sonnet 4 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Sonnet 4.5 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 3,600,000,000	不可	Anthropic Claude Sonnet 4.5 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Sonnet 4.5 V1 1M Context Length の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 720,000,000	不可	Anthropic Claude Sonnet 4.5 V1 1M Context Length のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Anthropic Claude Sonnet 4.6 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 3,600,000,000	不可	Anthropic Claude Sonnet 4.6 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Cohere Embed V4 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 216,000,000	不可	Cohere Embed V4 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
DeepSeek R1 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000	不可	DeepSeek R1 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
DeepSeek V3 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	DeepSeek V3 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
DeepSeek V3.2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	DeepSeek V3.2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
GPT OSS Safeguard 120B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	GPT OSS Safeguard 120B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
GPT OSS Safeguard 20B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	GPT OSS Safeguard 20B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Gemma 3 12B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Gemma 3 12B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Gemma 3 27B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Gemma 3 27B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Gemma 3 4B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Gemma 3 4B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Kimi K2 thinking の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Kimi K2 thinking のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Magistral Small 1.2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Magistral Small 1.2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Minimax M2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Minimax M2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Minimax M2.1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Minimax M2.1 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Ministral 14B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Ministral 14B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Ministral 3B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Ministral 3B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Ministral 8B 3.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Ministral 8B 3.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Mistral Devstral 2 123b の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Mistral Devstral 2 123b のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Mistral Large 3 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Mistral Large 3 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Moonshot AI Kimi K2.5 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Moonshot AI Kimi K2.5 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
NVIDIA Nemotron Nano 2 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	NVIDIA Nemotron Nano 2 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
NVIDIA Nemotron Nano 2 VL の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	NVIDIA Nemotron Nano 2 VL のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Nemotron Nano 3 30B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Nemotron Nano 3 30B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
OpenAI GPT OSS 120B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	OpenAI GPT OSS 120B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
OpenAI GPT OSS 20B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	OpenAI GPT OSS 20B のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 235B a22b 2507 V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 235B a22b 2507 V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 32B V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 32B V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 Coder 30B a3b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 Coder 30B a3b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 Coder 480B a35b V1 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 Coder 480B a35b V1 のモデル推論の日次最大トークン数。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 Coder Next の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 Coder Next のモデル推論の日次最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 Next 80B A3B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しの場合は 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 Next 80B A3B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Qwen3 VL 235B A22B の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Qwen3 VL 235B A22B のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Voxtral Mini 1.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Voxtral Mini 1.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Voxtral Small 1.0 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Voxtral Small 1.0 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Z.ai GLM-4.7 の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Z.ai GLM-4.7 のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
Z.ai GLM-4.7 Flash の 1 日あたりのモデル呼び出しの最大トークン数 (クロスリージョン呼び出しでは 2 倍)	サポートされている各リージョン: 144,000,000,000	不可	Z.ai GLM-4.7 Flash のモデル推論の毎日の最大トークン。Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計を組み合わせます。クロスリージョン呼び出しは 2 倍で、承認された TPM の増加には適用されません。
ベースモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数	サポートされている各リージョン: 0	あり	ベースモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数
カスタムモデル全体におけるコミットメントのないプロビジョンドスループットのモデルユニット数	サポートされている各リージョン: 0	あり	カスタムモデルのコミットメントのないプロビジョンドスループットに分散できるモデルユニットの最大数
AI21 Labs Jurassic-2 Mid のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	AI21 Labs Jurassic-2 Mid のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	AI21 Labs Jurassic-2 Ultra のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova 2 Lite V1.0 256K のプロビジョニング済みモデルあたりのモデルユニット	サポートされている各リージョン: 0	あり	Amazon Nova 2 Lite V1.0 256K のプロビジョニング済みモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Canvas のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Canvas のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Embeddings G1 – Text のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Embeddings G1 – Text のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Image Generator G1 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Image Generator G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Image Generator G2 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Image Generator G2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Lite V1 4K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Text Lite V1 4K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Multimodal Embeddings G1 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Text Embeddings V2 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Text Embeddings V2 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Text G1 – Express 8K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Text G1 – Express 8K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Titan Text Premier V1 32K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Titan Text Premier V1 32K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3 Haiku 48K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3 Haiku 48K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3 Sonnet 28K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Haiku 16K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Haiku 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Haiku 64K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet V2 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.5 Sonnet V2 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.7 V1.0 Sonnet 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.7 V1.0 Sonnet 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude 3.7 V1.0 Sonnet 51K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude Instant V1 100K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude Instant V1 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude V2 100K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude V2 100K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude V2 18K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude V2 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude V2.1 18K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude V2.1 18K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Anthropic Claude V2.1 200K のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Anthropic Claude V2.1 200K のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Command のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Command のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Command Light のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Command Light のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Command R のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Command R 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Command R Plus のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Command R Plus 128k のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Embed English のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Embed English のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Cohere Embed Multilingual のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Cohere Embed Multilingual のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 2 13B のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 2 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 2 70B のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 2 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 2 Chat 13B のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 2 Chat 13B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 2 Chat 70B のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 2 Chat 70B のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3 70B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3 8B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.1 70B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.1 70B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.1 8B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.1 8B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.2 11B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.2 11B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.2 1B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.2 1B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.2 3B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.2 3B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 3.2 90B Instruct のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 3.2 90B Instruct のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Mistral Large 2407 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Mistral Large 2407 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Mistral Small のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Mistral Small のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Stability.ai Stable Diffusion XL 0.8 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Stability.ai Stable Diffusion XL 1.0 のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Micro (128k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Lite (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Micro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Pro (24k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Lite (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルあたりのモデルユニット数	サポートされている各リージョン: 0	あり	Amazon Nova Pro (300k コンテキスト長バリアント) のプロビジョンドモデルに割り当てることができるモデルユニットの最大数。
Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 4 Scout 17B Instruct 10M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。
Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。
Meta Maverick 4 Scout 17B Instruct 128K 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 4 Maverick 17B Instruct 128K 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。
Meta Maverick 4 Scout 17B Instruct 1M 用に作成されたプロビジョンドスループットのコミットメント付きモデルユニット数	サポートされている各リージョン: 0	あり	Meta Llama 4 Maverick 17B Instruct 1M 用に作成されたプロビジョンドスループットにコミットメント付きで割り当てることができるモデルユニットの最大数。
ベースモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットのコミットなしモデルユニット	サポートされている各リージョン: 0	不可	コミットメントなしでベースモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットに割り当てることができるモデルユニットの最大数
カスタムモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットのコミットなしモデルユニット	サポートされている各リージョン: 0	不可	カスタムモデル Amazon Nova 2 Lite V1.0 256K 用に作成されたプロビジョンドスループットに割り当てることができるモデルユニットの最大数。コミットメントなし。
アカウントあたりのカスタムプロンプトルーターの数	サポートされている各リージョン: 500	不可	各リージョンのアカウントごとに作成できるカスタムプロンプトルーターの最大数。
Amazon Nova Pro V1 のオンデマンド、レイテンシー最適化モデル推論リクエスト/分	サポートされている各リージョン: 10	不可	Amazon Nova Pro V1 のモデル推論に 1 分間に送信できるオンデマンドのレイテンシー最適化リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数	サポートされている各リージョン: 100	不可	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数	サポートされている各リージョン: 100	不可	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Pro V1 のオンデマンド、レイテンシー最適化モデル推論トークン/分	サポートされている各リージョン: 40,000	不可	Amazon Nova Pro V1 のモデル推論に 1 分で送信できるオンデマンドのレイテンシー最適化トークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 405B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数	サポートされている各リージョン: 40,000	不可	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 70B Instruct の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数	サポートされている各リージョン: 40,000	不可	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるレイテンシーが最適化されたオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova 2 Multimodal Embeddings V1 のオンデマンドの InvokeModel 非同期同時リクエスト数	サポートされている各リージョン: 30	不可	Amazon Nova 2 Multimodal Embeddings V1 で送信できる非同期の同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
TwelveLabs Marengo Embed 3.0 のオンデマンド InvokeModel 非同期同時リクエスト	サポートされている各リージョン: 10	あり	TwelveLabs Marengo Embed 3.0 に送信できる非同期同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova 2 Sonic のオンデマンド InvokeModel 同時リクエスト	サポートされている各リージョン: 20	不可	Amazon Nova 2 Sonic に送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Reel1.0 のオンデマンドの InvokeModel 同時リクエスト数	サポートされている各リージョン: 10	不可	Amazon Nova Reel 1.0 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Reel1.1 のオンデマンドの InvokeModel 同時リクエスト数	サポートされている各リージョン: 3	不可	Amazon Nova Reel 1.1 で送信できる同時モデル推論リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Sonic のオンデマンドの InvokeModel 同時リクエスト数	サポートされている各リージョン: 20	不可	Amazon Nova Sonic でモデル推論のために送信できる同時リクエストの最大数。
Twelve Labs Marengo のオンデマンドの InvokeModel 同時リクエスト数	サポートされている各リージョン: 30	不可	Twelve Labs Marengo でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。
Twelve Labs Pegasus のオンデマンドの InvokeModel 同時リクエスト数	サポートされている各リージョン: 30	あり	Twelve Labs Pegasus でモデル推論のために送信できる InvokeModel の同時リクエストの最大数。
Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論リクエスト数	サポートされている各リージョン: 100	不可	1 分間にモデル推論を呼び出すことができる最大回数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Haiku の 1 分あたりのレイテンシー最適化済みオンデマンドモデル推論トークン数	サポートされている各リージョン: 500,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。レイテンシーの最適化が設定されている場合、クォータには Anthropic Claude 3.5 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Luma Ray V2 のオンデマンドのモデル推論同時リクエスト数	サポートされている各リージョン: 1	[いいえ]	Luma Ray V2 でモデル推論のために送信できる同時リクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	AI21 Labs Jamba 1.5 Large で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。
AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	AI21 Labs Jamba 1.5 Mini で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。
AI21 Labs Jamba Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	AI21 Labs Jamba Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse と InvokeModel のリクエストの合計が考慮されます。
AI21 Labs Jurassic-2 Mid の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	AI21 Labs Jurassic-2 Mid で 1 分間に InvokeModel を呼び出すことができる最大回数。
AI21 Labs Jurassic-2 Ultra の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	AI21 Labs Jurassic-2 Ultra で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Nova 2 Multimodal Embeddings V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Amazon Nova 2 Multimodal Embeddings V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Canvas の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	Amazon Nova Canvas でモデル推論のために 1 分間に送信できるリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Lite の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 2,000 eu-west-2: 2,000 他のサポートされている各リージョン: 200	不可	Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Micro の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 2,000 eu-west-2: 2,000 他のサポートされている各リージョン: 200	不可	Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Nova Pro の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 250	不可	Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Rerank 1.0 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 200	不可	Amazon Rerank 1.0 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Titan Image Generator G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	不可	Amazon Titan Image Generator G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	不可	Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Titan Text Embeddings の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Amazon Titan Text Embeddings で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 6,000	不可	Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Amazon Titan Text Express の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Titan Text Lite の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Titan Text Premier の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 1,000 us-west-2: 1,000 ap-northeast-1: 200 ap-southeast-1: 200 サポートされている他の各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3 Opus の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 50	不可	Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 500 us-west-2: 500 他のサポートされている各リージョン: 100	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-west-1: 400 他のサポートされている各リージョン: 1,000	不可	Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 50 us-east-2: 50 us-west-2: 250 ap-northeast-2: 50 ap-south-1: 50 ap-southeast-2: 50 他のサポートされている各リージョン: 20	不可	Anthropic Claude 3.5 Sonnet で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-west-2: 250 他のサポートされている各リージョン: 50	不可	Anthropic Claude 3.5 Sonnet V2 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 125	不可	Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Anthropic Claude Instant の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 1,000 us-west-2: 1,000 サポートされている他の各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude Instant の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude V2 の 1 分あたりのオンデマンドのモデル推論リクエスト数	us-east-1: 500 us-west-2: 500 他のサポートされている各リージョン: 100	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Anthropic Claude V2 の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Command の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Command Light の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command Light の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Command R の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Command R Plus の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Embed English の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Cohere Embed English で 1 分間に InvokeModel を呼び出すことができる最大回数。
Cohere Embed Multilingual の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2,000	不可	Cohere Embed Multilingual で 1 分間に InvokeModel を呼び出すことができる最大回数。
Cohere Embed V4 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 1,000	不可	Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Cohere Rerank 3.5 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 250	不可	Cohere Rerank 3.5 で 1 分間に InvokeModel を呼び出すことができる最大回数。
DeepSeek V3 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
DeepSeek V3.2 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	DeepSeek V3.2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
GPT OSS Safeguard 120B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	GPT OSS Safeguard 120B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
GPT OSS Safeguard 20B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	GPT OSS Safeguard 20B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Gemma 3 12B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Gemma 3 12B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Gemma 3 27B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Gemma 3 27B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Gemma 3 4B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Gemma 3 4B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Kimi K2 thinking の 1 分あたりのオンデマンドモデル推論リクエスト	サポートされている各リージョン: 10,000	不可	Kimi K2 Thinking でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Magistral Small 1.2 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Magistral Small 1.2 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 2 13B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 2 70B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 2 Chat 13B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 Chat 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 2 Chat 70B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Meta Llama 2 Chat 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 200	不可	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3.2 11B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。
Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Meta Llama 3.2 3B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。
Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3.2 90B Instruct で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。
Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Minimax M2 の 1 分あたりのオンデマンドモデル推論リクエスト	サポートされている各リージョン: 10,000	不可	Minimax M2 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Minimax M2.1 の 1 分あたりのオンデマンドモデル推論リクエスト	サポートされている各リージョン: 10,000	不可	Minimax M2.1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Ministral 14B 3.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Ministral 14B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Ministral 3B 3.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Ministral 3B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Ministral 8B 3.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Ministral 8B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Mistral 7B Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 800	不可	Mistral mistral-7b-instruct-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Mistral AI Mistral Small の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Mistral AI Mistral Small で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。
Mistral Devstral 2 123b のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Mistral Devstral 2 123b でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Mistral Large の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Mistral mistral-large-2402-v1 で 1 分間に InvokeModel と InvokeModelWithResponseStream を呼び出すことができる最大回数。
Mistral Large 2407 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Mistral Large 2407 で 1 分間にモデル推論を呼び出すことができる最大回数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のリクエストの合計が考慮されます。
Mistral Large 3 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Mistral Large 3 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Mistral Mixtral 8x7b Instruct の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 400	不可	Mistral mixtral-8x7b-v0 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Moonshot AI Kimi K2.5 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Moonshot AI Kimi K2.5 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
NVIDIA Nemotron Nano 2 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	NVIDIA Nemotron Nano 2 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
NVIDIA Nemotron Nano 2 VL のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	NVIDIA Nemotron Nano 2 VL のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Nemotron Nano 3 30B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Nemotron Nano 3 30B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
OpenAI GPT OSS 120B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
OpenAI GPT OSS 20B の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 32B V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10,000	不可	Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 Coder Next の 1 分あたりのオンデマンドモデル推論リクエスト	サポートされている各リージョン: 10,000	不可	Qwen3 Coder Next のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 Next 80B A3B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Qwen3 Next 80B A3B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Qwen3 VL 235B A22B のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Qwen3 VL 235B A22B のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stability.ai Stable Diffusion 3 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 15	不可	Stability.ai Stable Diffusion 3 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Diffusion 3 Medium の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	不可	Stability.ai Stable Diffusion 3 Medium で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Diffusion 3.5 Large の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 15	不可	Stability.ai Stable Diffusion 3.5 Large で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Diffusion XL 0.8 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	不可	Stability.ai Stable Diffusion XL 0.8 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Diffusion XL 1.0 の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	不可	Stability.ai Stable Diffusion XL 1.0 で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Image Core の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 90	不可	Stability.ai Stable Image Core で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stability.ai Stable Image Ultra の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stability.ai Stable Image Ultra で 1 分間に InvokeModel を呼び出すことができる最大回数。
Stable Image Conservative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2	不可	Stable Image Conservative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Control Sketch の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Control Sketch でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Control Structure の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Control Structure でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Creative Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2	不可	Stable Image Creative Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Erase Object の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Erase Object でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Fast Upscale の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Fast Upscale でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Inpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Inpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Outpaint の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 2	不可	Stable Image Outpaint でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Remove Background の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Remove Background でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Search and Recolor の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Search and Recolor でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Search and Replace の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Search and Replace でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Style Guide の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Style Guide でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Stable Image Style Transfer の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 10	不可	Stable Image Style Transfer でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Twelve Labs Marengo の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 100	不可	Twelve Labs Marengo でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Twelve Labs Pegasus の 1 分あたりのオンデマンドのモデル推論リクエスト数	サポートされている各リージョン: 60	あり	Twelve Labs Pegasus でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
TwelveLabs Marengo Embed 3.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 500	あり	TwelveLabs Marengo Embed 3.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Voxtral Mini 1.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Voxtral Mini 1.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Voxtral Small 1.0 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Voxtral Small 1.0 でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Z.ai GLM-4.7 のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Z.ai GLM-4.7 のモデル推論に 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
Z.ai GLM-4.7 Flash のオンデマンドモデル推論リクエスト/分	サポートされている各リージョン: 10,000	不可	Z.ai GLM-4.7 Flash でモデル推論のために 1 分間に送信できるオンデマンドリクエストの最大数。このクォータは、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream アクションへのリクエストの合計数を表します。
AI21 Labs Jamba 1.5 Large の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	AI21 Labs Jamba 1.5 Large でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。
AI21 Labs Jamba 1.5 Mini の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	AI21 Labs Jamba 1.5 Mini でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel へのすべてのリクエストの入出力トークンの合計が考慮されます。
AI21 Labs Jamba Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	AI21 Labs Jamba Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse と InvokeModel のトークンの合計が考慮されます。
AI21 Labs Jurassic-2 Mid の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、AI21 Labs Jurassic-2 Mid の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
AI21 Labs Jurassic-2 Ultra の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、AI21 Labs Jurassic-2 Ultra の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Amazon Nova Lite の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 4,000,000 eu-west-2: 4,000,000 サポートされている他の各リージョン: 200,000	不可	Amazon Nova Lite でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Micro の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 4,000,000 eu-west-2: 4,000,000 サポートされている他の各リージョン: 200,000	不可	Amazon Nova Micro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Nova Pro の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 1,000,000	不可	Amazon Nova Pro でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Titan Image Generator G1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 2,000	不可	Amazon Titan Image Generator G1 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Amazon Titan Image Generator G1 V2 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 2,000	不可	Amazon Titan Image Generator G1 V2 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Titan Multimodal Embeddings G1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Amazon Titan Multimodal Embeddings G1 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Amazon Titan Text Embeddings の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Amazon Titan Text Embeddings で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Amazon Titan Text Embeddings V2 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Amazon Titan Text Embeddings V2 で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Amazon Titan Text Express の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Express の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Titan Text Lite の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Lite の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Amazon Titan Text Premier の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Amazon Titan Text Premier の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Haiku の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 2,000,000 us-west-2: 2,000,000 ap-northeast-1: 200,000 ap-southeast-1: 200,000 サポートされている他の各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Haiku の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Opus の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 400,000	不可	Anthropic Claude 3 Opus でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 1,000,000 us-west-2: 1,000,000 サポートされている他の各リージョン: 200,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude 3 Sonnet の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3.5 Haiku の 1 分あたりのオンデマンドモデル推論トークン数	us-west-1: 300,000 サポートされている他の各リージョン: 2,000,000	不可	Anthropic Claude 3.5 Haiku でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude 3.5 Sonnet の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 400,000 us-east-2: 400,000 us-west-2: 2,000,000 ap-northeast-2: 400,000 ap-south-1: 400,000 ap-southeast-2: 400,000 サポートされている他の各リージョン: 200,000	不可	Anthropic Claude 3.5 Sonnet でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.5 Sonnet V2 の 1 分あたりのオンデマンドモデル推論トークン数	us-west-2: 2,000,000 サポートされている他の各リージョン: 400,000	不可	Anthropic Claude 3.5 Sonnet V2 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Anthropic Claude 3.7 Sonnet V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 500,000	不可	Anthropic Claude 3.7 Sonnet V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude Instant の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 1,000,000 us-west-2: 1,000,000 サポートされている他の各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude Instant の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Anthropic Claude V2 の 1 分あたりのオンデマンドモデル推論トークン数	us-east-1: 500,000 us-west-2: 500,000 サポートされている他の各リージョン: 200,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Anthropic Claude V2 の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Command の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Command Light の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	1 分間にモデル推論を呼び出すことができる最大回数。クォータには、Cohere Command Light の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream の合計が考慮されます。
Cohere Command R の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Command R Plus の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Cohere Command R Plus 128k の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Cohere Embed English の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Cohere Embed English で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Cohere Embed Multilingual の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Cohere Embed Multilingual で 1 分間に InvokeModel を通じて提供できるトークンの最大数。
Cohere Embed V4 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 150,000	不可	Cohere Embed V4 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
DeepSeek V3 V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	DeepSeek V3 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
DeepSeek V3.2 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	DeepSeek V3.2 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
GPT OSS Safeguard 120B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	GPT OSS Safeguard 120B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
GPT OSS Safeguard 20B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	GPT OSS Safeguard 20B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Gemma 3 12B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Gemma 3 12B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Gemma 3 27B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Gemma 3 27B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Gemma 3 4B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Gemma 3 4B のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Kimi K2 thinking のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Kimi K2 thinking のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Magistral Small 1.2 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Magistral Small 1.2 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 2 13B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 2 70B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 2 Chat 13B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 Chat 13B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 2 Chat 70B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Meta Llama 2 Chat 70B の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 405B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 400,000	不可	Meta Llama 3.1 405B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.1 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.1 8B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.1 8B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.2 11B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.2 11B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。
Meta Llama 3.2 1B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.2 1B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Meta Llama 3.2 3B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.2 3B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。
Meta Llama 3.2 90B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.2 90B Instruct でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。
Meta Llama 3.3 70B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Meta Llama 3.3 70B Instruct でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Minimax M2 の 1 分あたりのオンデマンドモデル推論トークン	サポートされている各リージョン: 100,000,000	不可	Minimax M2 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Minimax M2.1 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Minimax M2.1 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Ministral 14B 3.0 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Ministral 14B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Ministral 3B 3.0 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Ministral 3B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Ministral 8B 3.0 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Ministral 8B 3.0 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral AI Mistral 7B Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral 7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral AI Mistral Large の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Large の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral AI Mistral Small の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mistral Small の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral AI Mixtral 8X7BB Instruct の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	モデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Mistral AI Mixtral 8X7B Instruct の Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral Devstral 2 123b のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Mistral Devstral 2 123b のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Mistral Large 2407 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 300,000	不可	Mistral Large 2407 でモデル推論のために 1 分間に送信できるトークンの最大数。クォータには、InvokeModel、InvokeModelWithResponseStream、Converse、ConverseStream のトークンの合計が考慮されます。
Mistral Large 3 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Mistral Large 3 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Moonshot AI Kimi K2.5 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Moonshot AI Kimi K2.5 のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
NVIDIA Nemotron Nano 2 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	NVIDIA Nemotron Nano 2 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
NVIDIA Nemotron Nano 2 VL のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	NVIDIA Nemotron Nano 2 VL のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Nemotron Nano 3 30B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Nemotron Nano 3 30B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
OpenAI GPT OSS 120B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	OpenAI GPT OSS 120B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
OpenAI GPT OSS 20B の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	OpenAI GPT OSS 20B でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 235B a22b 2507 V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	Qwen3 235B a22b 2507 V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 32B V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	Qwen3 32B V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 Coder 30B a3b V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	Qwen3 Coder 30B a3b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 Coder 480B a35b V1 の 1 分あたりのオンデマンドモデル推論トークン数	サポートされている各リージョン: 100,000,000	不可	Qwen3 Coder 480B a35b V1 でモデル推論のために 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 Coder Next のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Qwen3 Coder Next のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 Next 80B A3B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Qwen3 Next 80B A3B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Qwen3 VL 235B A22B のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Qwen3 VL 235B A22B のモデル推論に 1 分間に送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Voxtral Mini 1.0 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Voxtral Mini 1.0 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Voxtral Small 1.0 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Voxtral Small 1.0 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Z.ai GLM-4.7 のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Z.ai GLM-4.7 のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
Z.ai GLM-4.7 Flash のオンデマンドモデル推論トークン/分	サポートされている各リージョン: 100,000,000	不可	Z.ai GLM-4.7 Flash のモデル推論に 1 分で送信できるオンデマンドトークンの最大数。クォータには、Converse、ConverseStream、InvokeModel、InvokeModelWithResponseStream へのすべてのリクエストの入出力トークンの合計が考慮されます。
関数ごとのパラメータ数	サポートされている各リージョン： 5	あり	アクショングループ関数に含めることができるパラメータの最大数。
1 秒あたりの PrepareAgent リクエスト数	サポートされている各リージョン: 2	不可	PrepareAgent API リクエストの 1 秒あたりの最大数。
Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Amazon Nova Premier のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Amazon Nova Premier のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3 Haiku のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3 Opus のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Opus のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3 Sonnet のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3.5 Haiku のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Haiku のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3.5 Sonnet のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Sonnet v2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude 3.7 Sonnet のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.7 Sonnet のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Haiku 4.5 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Haiku 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Opus 4.5 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Opus 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Opus 4.6 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Opus 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Sonnet 4 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Claude Sonnet 4 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Sonnet 4.5 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Sonnet 4.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Claude Sonnet 4.6 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン: 100,000	あり	Claude Sonnet 4.6 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
DeepSeek V3.2 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	DeepSeek V3.2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
DeepSeek v3 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	DeepSeek v3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Devstral 2 123B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン: 100,000	あり	Devstral 2 123B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
GLM 4.7 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	GLM 4.7 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
GLM 4.7 Flash のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	GLM 4.7 Flash のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Gemma 3 12B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Gemma 3 27B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 27B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Gemma 3 4B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 4B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Kimi K2 thinking のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Kimi K2 thinking のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Kimi K2.5 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Kimi K2.5 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.1 405B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 405B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.1 70B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.1 8B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 8B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.2 11B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 11B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.2 1B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 1B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.2 3B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 3B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.2 90B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 90B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 3.3 70B Instruct のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.3 70B Instruct のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 4 Maverick のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 4 Maverick のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Llama 4 Scout のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Llama 4 Scout のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Magistral Small 2509 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Magistral Small 2509 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
MiniMax M2 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	MiniMax M2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
MiniMax M2.1 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	MiniMax M2.1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Ministral 3 14B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3 14B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Ministral 3 8B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3 8B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Ministral 3B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Mistral Large 2 (24.07) のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Mistral Large 2 (24.07) のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Mistral Large 3 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Mistral Large 3 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Mistral Small のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Mistral Small のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 12B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 9B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Nova 2 Lite のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Nova 2 Lite のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Nova Lite V1 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Nova Lite V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Nova Micro V1 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Nova Micro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Nova Pro V1 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Nova Pro V1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
OpenAI GPT OSS 120b のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
OpenAI GPT OSS 20b のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 235B のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 32B のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 32B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 Coder 30B のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 Coder 30B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 Coder 480B のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 Coder 480B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 Coder Next のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 Coder Next のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 Next 80B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 Next 80B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Qwen3 VL 235B のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 VL 235B のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Titan Multimodal Embeddings G1 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Titan Text Embeddings V2 のバッチ推論ジョブあたりのレコード数	サポートされている各リージョン：50,000	あり	Titan Text Embeddings V2 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Voxtral Mini 3B 2507 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Voxtral Mini 3B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Voxtral Small 24B 2507 のバッチ推論ジョブあたりのレコード	サポートされている各リージョン：50,000	あり	Voxtral Small 24B 2507 のバッチ推論ジョブ内のすべての入力ファイルにわたるレコードの最大数。
Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Amazon Nova 2 マルチモーダル埋め込み V1 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Amazon Nova Premier のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Amazon Nova Premier のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3 Opus のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Opus のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3.5 Haiku のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Haiku のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3.5 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3.5 Sonnet v2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.5 Sonnet v2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude 3.7 Sonnet のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude 3.7 Sonnet のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude Haiku 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Haiku 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Claude Opus 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Opus 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Claude Opus 4.6 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Opus 4.6 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Claude Sonnet 4 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Claude Sonnet 4 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Claude Sonnet 4.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Claude Sonnet 4.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Claude Sonnet 4.6 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン: 100,000	あり	Claude Sonnet 4.6 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
DeepSeek V3.2 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	DeepSeek V3.2 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
DeepSeek v3 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	DeepSeek v3 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Devstral 2 123B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン: 100,000	あり	Devstral 2 123B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
GLM 4.7 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	GLM 4.7 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
GLM 4.7 Flash のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	GLM 4.7 Flash のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Gemma 3 12B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 12B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Gemma 3 27B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 27B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Gemma 3 4B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Gemma 3 4B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Kimi K2 thinking のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Kimi K2 thinking のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Kimi K2.5 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Kimi K2.5 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Llama 3.1 405B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 405B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.1 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.1 8B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.1 8B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.2 11B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 11B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.2 1B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 1B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.2 3B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 3B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.2 90B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.2 90B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 3.3 70B Instruct のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 3.3 70B Instruct のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 4 Maverick のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 4 Maverick のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Llama 4 Scout のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Llama 4 Scout のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Magistral Small 2509 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Magistral Small 2509 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
MiniMax M2 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	MiniMax M2 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
MiniMax M2.1 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	MiniMax M2.1 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Ministral 3 14B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3 14B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Ministral 3 8B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3 8B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Ministral 3B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Ministral 3B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Mistral Large 2 (24.07) のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Mistral Large 2 (24.07) のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Mistral Large 3 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Mistral Large 3 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Mistral Small のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Mistral Small のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
NVIDIA Nemotron Nano 12B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 12B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 3 30B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
NVIDIA Nemotron Nano 9B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	NVIDIA Nemotron Nano 9B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Nova 2 Lite のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Nova 2 Lite のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Nova Lite V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Nova Lite V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Nova Micro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Nova Micro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Nova Pro V1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Nova Pro V1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
OpenAI GPT OSS 120b のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS 120b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
OpenAI GPT OSS 20b のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS 20b のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS Safeguard 120b のバッチ推論ジョブの入力ファイル内のレコードの最大数。
OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	OpenAI GPT OSS Safeguard 20b のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Qwen3 235B のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 235B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Qwen3 32B のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 32B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Qwen3 Coder 30B のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 Coder 30B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Qwen3 Coder 480B のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Qwen3 Coder 480B のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Qwen3 Coder Next のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 Coder Next のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Qwen3 Next 80B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 Next 80B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Qwen3 VL 235B のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Qwen3 VL 235B のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Titan Multimodal Embeddings G1 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Titan Multimodal Embeddings G1 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Titan Text Embeddings V2 のバッチ推論ジョブあたりの入力ファイルごとのレコード数	サポートされている各リージョン：50,000	あり	Titan Text Embeddings V2 のバッチ推論ジョブ内の入力ファイルのレコードの最大数。
Voxtral Mini 3B 2507 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Voxtral Mini 3B 2507 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Voxtral Small 24B 2507 のバッチ推論ジョブあたりの入力ファイルあたりのレコード	サポートされている各リージョン：50,000	あり	Voxtral Small 24B 2507 のバッチ推論ジョブの入力ファイル内のレコードの最大数。
Amazon Nova 2 マルチモーダル埋め込み V1 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Amazon Nova 2 マルチモーダル埋め込み V1 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Amazon Nova Premier のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Amazon Nova Premier のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3 Opus のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3 Opus のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3.5 Haiku のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3.5 Haiku のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3.5 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3.5 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3.5 Sonnet v2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3.5 Sonnet v2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude 3.7 Sonnet のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude 3.7 Sonnet のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude Haiku 4.5 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude Haiku 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Claude Opus 4.5 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude Opus 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Claude Opus 4.6 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude Opus 4.6 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Claude Sonnet 4 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Claude Sonnet 4 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Claude Sonnet 4.5 のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計。	サポートされている各リージョン: 20	可能	Claude Sonnet 4.5 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Claude Sonnet 4.6 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 100	可能	Claude Sonnet 4.6 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
DeepSeek V3.2 のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	DeepSeek V3.2 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
DeepSeek v3 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	DeepSeek v3 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Devstral 2 123B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 100	可能	Devstral 2 123B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
GLM 4.7 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	GLM 4.7 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
GLM 4.7 Flash のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	GLM 4.7 Flash のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Gemma 3 12B のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Gemma 3 12B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Gemma 3 27B のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Gemma 3 27B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Gemma 3 4B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Gemma 3 4B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Kimi K2 thinking の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Kimi K2 Think の基本モデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Kimi K2.5 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Kimi K2.5 のベースモデルを使用して、進行中および送信されたバッチ推論ジョブの最大数。
Llama 3.1 405B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.1 405B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.1 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.1 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.1 8B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.1 8B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.2 11B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.2 11B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.2 1B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.2 1B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.2 3B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.2 3B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.2 90B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.2 90B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 3.3 70B Instruct のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 3.3 70B Instruct のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 4 Maverick のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 4 Maverick のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Llama 4 Scout のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Llama 4 Scout のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Magistral Small 2509 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Magistral Small 2509 の基本モデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
MiniMax M2 のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	MiniMax M2 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
MiniMax M2.1 の基本モデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	MiniMax M2.1 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Ministral 3 14B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Ministral 3 14B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Ministral 3 8B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Ministral 3 8B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの最大数。
Ministral 3B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Ministral 3B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Mistral Large 2 (24.07) のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Mistral Large 2 (24.07) のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Mistral Large 3 の基本モデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Mistral Large 3 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Mistral Small のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Mistral Small のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
NVIDIA Nemotron Nano 12B のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	NVIDIA Nemotron Nano 12B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
NVIDIA Nemotron Nano 3 30B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	NVIDIA Nemotron Nano 3 30B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
NVIDIA Nemotron Nano 9B のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	NVIDIA Nemotron Nano 9B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Nova 2 Lite のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Nova 2 Lite のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Nova Lite V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Nova Lite V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Nova Micro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Nova Micro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Nova Pro V1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Nova Pro V1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
OpenAI GPT OSS 120b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	OpenAI GPT OSS 120b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
OpenAI GPT OSS 20b のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	OpenAI GPT OSS 20b のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
OpenAI GPT OSS Safeguard 120b のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	OpenAI GPT OSS Safeguard 120b のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
OpenAI GPT OSS Safeguard 20b のベースモデルを使用した、進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	OpenAI GPT OSS Safeguard 20b のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Qwen3 235B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 235B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Qwen3 32B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 32B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Qwen3 Coder 30B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 Coder 30B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Qwen3 Coder 480B のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 Coder 480B のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Qwen3 Coder Next のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 Coder Next のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Qwen3 Next 80B のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 Next 80B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Qwen3 VL 235B のベースモデルを使用した進行中および送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Qwen3 VL 235B のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Titan Multimodal Embeddings G1 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Titan Multimodal Embeddings G1 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Titan Text Embeddings V2 のベースモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Titan Text Embeddings V2 のベースモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Voxtral Mini 3B 2507 のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Voxtral Mini 3B 2507 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Voxtral Small 24B 2507 のベースモデルを使用した進行中のバッチ推論ジョブと送信されたバッチ推論ジョブの合計	サポートされている各リージョン: 20	可能	Voxtral Small 24B 2507 のベースモデルを使用した、進行中および送信されたバッチ推論ジョブの最大数。
Titan Multimodal Embeddings G1 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 3	不可	Titan Multimodal Embeddings G1 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Titan Text Embeddings V2 のカスタムモデルを使用した進行中および送信済みのバッチ推論ジョブの合計	サポートされている各リージョン: 3	不可	Titan Text Embeddings V2 のカスタムモデルを使用した、進行中のバッチ推論ジョブおよび送信済みのバッチ推論ジョブの最大数。
Bedrock Data Automation ランタイムのスロットルレート制限: ListTagsForResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数
Bedrock Data Automation ランタイムのスロットルレート制限: TagResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数
Bedrock Data Automation ランタイムのスロットルレート制限: UntagResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation ランタイムの最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数
Bedrock Data Automation のスロットルレート制限: ListTagsForResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる ListTagsForResource リクエスト数
Bedrock Data Automation のスロットルレート制限: TagResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる TagResource リクエスト数
Bedrock Data Automation のスロットルレート制限: UntagResource	サポートされている各リージョン: 25/秒	不可	Bedrock Data Automation の最大数: 現在のリージョンでアカウントごと、1 秒あたりに実行できる UntagResource リクエスト数
CreateBlueprint のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprint リクエストの最大数
CreateBlueprintVersion のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateBlueprintVersion リクエストの最大数
CreateDataAutomationProject のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる CreateDataAutomationProject リクエストの最大数
DeleteBlueprint のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteBlueprint リクエストの最大数
DeleteDataAutomationProject のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる DeleteDataAutomationProject リクエストの最大数
GetBlueprint のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる GetBlueprint リクエストの最大数
GetDataAutomationProject のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationProject リクエストの最大数
GetDataAutomationStatus のスロットルレート制限	サポートされている各リージョン：10/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる GetDataAutomationStatus リクエストの最大数
InvokeDataAutomationAsync のスロットルレート制限	サポートされている各リージョン：10/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる InvokeDataAutomationAsync リクエストの最大数
ListBlueprints のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる ListBlueprints リクエストの最大数
ListDataAutomationProjects のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる ListDataAutomationProjects リクエストの最大数
UpdateBlueprint のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateBlueprint リクエストの最大数
UpdateDataAutomationProject のスロットルレート制限	サポートされている各リージョン: 5/秒	不可	現在のリージョンでアカウントごと、1 秒あたりに実行できる UpdateDataAutomationProject リクエストの最大数
1 秒あたりの UpdateAgent リクエスト数	サポートされている各リージョン: 4	不可	UpdateAgent API リクエストの 1 秒あたりの最大数。
1 秒あたりの UpdateAgentActionGroup リクエスト数	サポートされている各リージョン: 6	不可	UpdateAgentActionGroup API リクエストの 1 秒あたりの最大数。
1 秒あたりの UpdateAgentAlias リクエスト数	サポートされている各リージョン: 2	不可	UpdateAgentAlias API リクエストの 1 秒あたりの最大数。
1 秒あたりの UpdateAgentKnowledgeBase リクエスト数	サポートされている各リージョン: 4	不可	UpdateAgentKnowledgeBase API リクエストの 1 秒あたりの最大数。

注記

アカウントのクォータ引き上げをリクエストするには、以下のステップを実行します。

クォータが [あり] とマークされている場合は、「Service Quotas ユーザーガイド」の「Requesting a Quota Increase」に記載の手順でクォータを調整できます。
クォータが [なし] とマークされている場合は、制限引き上げのフォームを使用して引き上げを検討するようリクエストを送信できます。
モデルを問わず、以下のクォータの引き上げを一緒にリクエストすることができます。
- ${model} の 1 分あたりのクロスリージョン InvokeModel トークン
- ${model} の 1 分あたりのクロスリージョン InvokeModel リクエスト
- ${model} の 1 分あたりのオンデマンド InvokeModel トークン
- ${model} の 1 分あたりのオンデマンド InvokeModel リクエスト
上記のクォータの任意の組み合わせの引き上げをリクエストするには、「Service Quotas ユーザーガイド」の「Requesting a Quota Increase」に記載の手順に沿って ${model} の 1 分あたりのクロスリージョン InvokeModel トークンのクォータの引き上げをリクエストしてください。その後、サポートチームからお客様にご連絡し、その他の 3 つのクォータを引き上げるオプションを提供いたします。圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様に優先権が与えられます。この条件を満たしていない場合、リクエストは拒否されることがあります。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

AWS Batch

Amazon Bedrock AgentCore