翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 容量、制限、コストの最適化
<a name="capacity-limits-cost-optimization"></a>

Amazon Bedrock には、ワークロードの要件と予算に合わせて柔軟な容量オプションが用意されています。オンデマンド階層 (Flex、Priority、Standard)、リザーブド階層、バッチ処理、クロスリージョン推論の違いを理解することで、パフォーマンスとコストの両方を最適化できます。

# パフォーマンスとコストを最適化するためのサービス階層
<a name="service-tiers-inference"></a>

Amazon Bedrock には、Reserved、Priority、Standard、Flex の 4 つのサービス階層があります。サービス層を使用すると、可用性、コスト、パフォーマンスを最適化できます。

## 予約済み階層
<a name="w2aac26b5b5"></a>

リザーブド階層は、ダウンタイムを許容できないミッションクリティカルなアプリケーションの優先コンピューティングキャパシティを予約する機能を提供します。ワークロードの正確な要件と制御コストに合わせて、1 tokens-per-minuteを柔軟に割り当てることができます。アプリケーションが予約した容量よりも多くのtokens-per-minute容量を必要とする場合、サービスは自動的に標準階層にオーバーフローし、中断のないオペレーションを確保します。リザーブド階層は、モデルレスポンスの 99.5% の稼働時間を目標とします。お客様は 1 か月または 3 か月間キャパシティを予約できます。お客様は 1 分あたり 1K000 トークンあたりの固定料金を支払い、毎月請求されます。 tokens-per-minute 

リザーブド階層にアクセスするには、AWS アカウントチームにお問い合わせください。

**注記**  
請求は、 AWS アカウント マネージャーの助けを借りてリザーブド階層の予約を削除するまで続行されます。

## Priority 階層
<a name="w2aac26b5b7"></a>

Priority 階層は、標準のオンデマンド料金よりも料金プレミアムで最速の応答時間を提供します。これは、24X7 365 日のキャパシティ予約を必要としない顧客向けビジネスワークフローを持つミッションクリティカルなアプリケーションに最適です。Priority 階層には事前予約は必要ありません。リクエストレベルの優先順位付けを有効にするには、「service\$1tier」オプションパラメータを「priority」に設定するだけです。優先度階層リクエストは、標準および Flex 階層リクエストよりも優先されます。

## 標準階層
<a name="w2aac26b5b9"></a>

標準階層は、コンテンツ生成、テキスト分析、日常的なドキュメント処理などの日常的な AI タスクに一貫したパフォーマンスを提供します。デフォルトでは、「service\$1tier」パラメータがない場合、すべての推論リクエストは標準階層にルーティングされます。標準階層で提供される推論リクエストの「service\$1tier」オプションパラメータを「default」に設定することもできます。

## Flex 階層
<a name="w2aac26b5c11"></a>

より長い処理時間を処理できるワークロードの場合、Flex 階層は料金割引のための費用対効果の高い処理を提供します。これにより、モデル評価、コンテンツ要約、エージェントワークフローなどのワークロードのコストを最適化できます。Flex 階層で提供される推論リクエストの「service\$1tier」オプションパラメータを「flex」に設定し、料金割引を利用できます。

## サービス階層機能の使用
<a name="w2aac26b5c13"></a>

サービス階層機能にアクセスするには、Amazon Bedrock ランタイム API を呼び出すときに、「service\$1tier」オプションパラメータを「reserved」、「priority」、「default」、または「flex」に設定します。

```
"service_tier" : "reserved | priority | default | flex"
```

モデルのオンデマンドクォータは、「優先度」、「デフォルト」、「柔軟性」の各サービス階層で共有されます。「予約済み」階層のキャパシティ予約は、オンデマンドクォータとは別のものです。サービス対象のリクエストのサービス階層設定は、API レスポンスと AWS CloudTrail Events に表示されます。ModelId、ServiceTier、ResolvedServiceTier の Amazon CloudWatch Metrics でサービス階層メトリクスを表示することもできます。ここで、ResolvedServiceTier はリクエストを処理した実際の階層を表示します。

料金の詳細については、[料金](https://aws.amazon.com/bedrock/pricing/)ページを参照してください。

リザーブドサービス階層でサポートされているモデルとリージョン:


|  |  |  |  | 
| --- |--- |--- |--- |
| プロバイダー | モデル | モデル ID | Regions | 
| Anthropic | Claude Sonnet 4.6 | global.anthropic.claude-sonnet-4-6us.anthropic.claude-sonnet-4-6eu.anthropic.claude-sonnet-4-6 | ap-northeast-1 | 
| ap-northeast-2 | 
| ap-northeast-3 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-south-1 | 
| ap-southeast-3 | 
| ap-south-2 | 
| ap-southeast-4 | 
| ca-central-1 | 
| eu-west-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| me-south-1 | 
| ap-southeast-7 | 
| af-south-1 | 
| me-central-1 | 
| ap-southeast-5 | 
| mx-central-1 | 
| il-central-1 | 
| ap-east-2 | 
| ca-west-1 | 
| Anthropic | Claude Opus 4.6 | global.anthropic.claude-opus-4-6-v1us.anthropic.claude-opus-4-6-v1eu.anthropic.claude-opus-4-6-v1 | af-south-1 | 
| ap-east-2 | 
| ap-northeast-1 | 
| ap-northeast-2 | 
| ap-northeast-3 | 
| ap-south-1 | 
| ap-south-2 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ap-southeast-4 | 
| ap-southeast-5 | 
| ap-southeast-7 | 
| ca-central-1 | 
| ca-west-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| il-central-1 | 
| me-central-1 | 
| me-south-1 | 
| mx-central-1 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| Anthropic | Claude Sonnet 4.5 | global.anthropic.claude-sonnet-4-5-20250929-v1:0us.anthropic.claude-sonnet-4-5-20250929-v1:0eu.anthropic.claude-sonnet-4-5-20250929-v1:0us-gov.anthropic.claude-sonnet-4-5-20250929-v1:0 | ap-northeast-1 | 
| ap-northeast-2 | 
| ap-northeast-3 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-south-1 | 
| ap-southeast-3 | 
| ap-south-2 | 
| ap-southeast-4 | 
| ca-central-1 | 
| eu-west-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| us-gov-west-1 | 
| Anthropic | Claude Opus 4.5 | global.anthropic.claude-opus-4-5-20251101-v1:0us.anthropic.claude-opus-4-5-20251101-v1:0eu.anthropic.claude-opus-4-5-20251101-v1:0 | ap-northeast-1 | 
| ap-northeast-2 | 
| ap-northeast-3 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-south-1 | 
| ap-southeast-3 | 
| ap-south-2 | 
| ap-southeast-4 | 
| ca-central-1 | 
| eu-west-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| Anthropic | Claude Haiku 4.5 | global.anthropic.claude-haiku-4-5-20251001-v1:0us.anthropic.claude-haiku-4-5-20251001-v1:0eu.anthropic.claude-haiku-4-5-20251001-v1:0 | ap-northeast-1 | 
| ap-northeast-2 | 
| ap-northeast-3 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-south-1 | 
| ap-southeast-3 | 
| ap-south-2 | 
| ap-southeast-4 | 
| ca-central-1 | 
| eu-west-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 

**注記**  
Sonnet 4.5 の 1Mコンテキスト長は、リザーブド階層ではサポートされていません。

Priority および Flex サービス階層でサポートされているモデルとリージョン:


|  |  |  |  | 
| --- |--- |--- |--- |
| プロバイダー | モデル | モデル ID | Regions | 
| OpenAI | gpt-oss-120b | openai.gpt-oss-120b-1:0 | us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-west-1 | 
| eu-west-2 | 
| sa-east-1 | 
| OpenAI | gpt-oss-20b | openai.gpt-oss-20b-1:0 | us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-west-1 | 
| eu-west-2 | 
| sa-east-1 | 
| OpenAI | GPT OSS Safeguard 20B | openai.gpt-oss-safeguard-20b | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| OpenAI | GPT OSS Safeguard 120B | openai.gpt-oss-safeguard-120b | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Qwen | Qwen3 235B A22B 2507 | qwen.qwen3-235b-a22b-2507-v1:0 | us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-west-2 | 
| Qwen | Qwen3 Coder 480B A35B Instruct | qwen.qwen3-coder-480b-a35b-v1:0 | us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-north-1 | 
| eu-west-2 | 
| Qwen | Qwen3-Coder-30B-A3B-Instruct | qwen.qwen3-coder-30b-a3b-v1:0 | us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-west-1 | 
| eu-west-2 | 
| sa-east-1 | 
| Qwen | Qwen3 32B (dense) | qwen.qwen3-32b-v1:0 | us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-west-1 | 
| eu-west-2 | 
| sa-east-1 | 
| Qwen | Qwen3 Next 80B A3B | qwen.qwen3-next-80b-a3b | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Qwen | Qwen3 VL 235B A22B | qwen.qwen3-vl-235b-a22b | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| DeepSeek | DeepSeek-V3.1 | deepseek.v3-v1:0 | us-east-2 | 
| us-west-2 | 
| ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-3 | 
| eu-north-1 | 
| eu-west-2 | 
| Amazon | Nova Premier | amazon.nova-premier-v1:0 | us-east-1\$1 | 
| us-east-2\$1 | 
| us-west-2\$1 | 
| Amazon | Nova Pro | amazon.nova-pro-v1:0 | us-east-1 | 
| us-east-2\$1 | 
| us-west-1\$1 | 
| us-west-2\$1 | 
| ap-east-2\$1 | 
| ap-northeast-1\$1 | 
| ap-northeast-2\$1 | 
| ap-south-1\$1 | 
| ap-southeast-1\$1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ap-southeast-4\$1 | 
| ap-southeast-5\$1 | 
| ap-southeast-7\$1 | 
| eu-central-1\$1 | 
| eu-north-1\$1 | 
| eu-south-1\$1 | 
| eu-south-2\$1 | 
| eu-west-1\$1 | 
| eu-west-2 | 
| eu-west-3\$1 | 
| il-central-1\$1 | 
| me-central-1 | 
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v1:0 | ap-east-2 | 
| ap-northeast-1 | 
| ap-northeast-2 | 
| ap-south-1 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ap-southeast-4 | 
| ap-southeast-5 | 
| ap-southeast-7 | 
| ca-central-1 | 
| ca-west-1 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| il-central-1 | 
| me-central-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| Amazon | Nova 2 Pro Preview | amazon.nova-2-pro-preview-20251202-v1:0 | ap-east-2 | 
| ap-northeast-1 | 
| ap-northeast-2 | 
| ap-south-1 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ap-southeast-4 | 
| ap-southeast-5 | 
| ap-southeast-7 | 
| ca-central-1 | 
| ca-west-1 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| il-central-1 | 
| me-central-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| Amazon | Nova Lite 2 Omni | amazon.nova-2-lite-omni-v1 | ap-east-2 | 
| ap-northeast-1 | 
| ap-northeast-2 | 
| ap-south-1 | 
| ap-southeast-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ap-southeast-4 | 
| ap-southeast-5 | 
| ap-southeast-7 | 
| ca-central-1 | 
| ca-west-1 | 
| eu-central-1 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| il-central-1 | 
| me-central-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-1 | 
| us-west-2 | 
| Google | Gemma 3 4B | google.gemma-3-4b-it | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Google | Gemma 3 12B | google.gemma-3-12b-it | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Google | Gemma 3 27B | google.gemma-3-27b-it | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Minimax AI | Minimax M2 | minimax.minimax-m2 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Magistral Small 1.2 | mistral.magistral-small-2509 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Voxtral Mini 1.0 | mistral.voxtral-mini-3b-2507 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Voxtral Small 1.0 | mistral.voxtral-small-24b-2507 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Ministral 3B 3.0 | mistral.ministral-3-3b-instruct | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Ministral 8B 3.0 | mistral.ministral-3-8b-instruct | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Ministral 14B 3.0 | mistral.ministral-3-14b-instruct | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Mistral | Mistral Large 3 | mistral.mistral-large-3-675b-instruct | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Kimi AI | Kimi K2 Thinking | moonshot.kimi-k2-thinking | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Nvidia | NVIDIA Nemotron Nano 2 | nvidia.nemotron-nano-9b-v2 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 
| Nvidia | NVIDIA Nemotron Nano 2 VL | nvidia.nemotron-nano-12b-v2 | ap-northeast-1 | 
| ap-south-1 | 
| ap-southeast-2 | 
| ap-southeast-3 | 
| ca-central-1 | 
| eu-central-1 | 
| eu-central-2 | 
| eu-north-1 | 
| eu-south-1 | 
| eu-south-2 | 
| eu-west-1 | 
| eu-west-2 | 
| eu-west-3 | 
| sa-east-1 | 
| us-east-1 | 
| us-east-2 | 
| us-west-2 | 

 \$1モデル推論は、複数のリージョンを使用して提供できます。

サービス階層へのアクセスを制御するには、「」を参照してください。 [サービス階層へのアクセスを制御する](security_iam_id-based-policy-examples-agent.md#security_iam_id-based-policy-examples-service-tiers)

## キャパシティオプション
<a name="capacity-options"></a>


| キャパシティタイプ | ユースケース | 主な特徴 | 
| --- | --- | --- | 
| オンデマンド: Flex | ボリュームの少ない散発的なワークロード |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 
| オンデマンド: 標準 | 通常の本稼働ワークロード |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 
| オンデマンド: Priority | 優先度が高く、レイテンシーの影響を受けやすいアプリケーション |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 
| 予約済み階層 | 一貫性のある大量のワークロード |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 
| バッチ | 時間non-time-sensitive大規模な処理 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 
| クロスリージョン推論 | 高可用性、トラフィックバースト |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/capacity-limits-cost-optimization.html)  | 

## 制限とクォータ
<a name="limits-quotas"></a>

### オンデマンド制限 (階層別)
<a name="on-demand-limits"></a>


| Tier | RPM 範囲 | TPM 範囲 | スロットリングリスク | 
| --- | --- | --- | --- | 
| Flex | 10-100 | 5K-50K | 高 | 
| 標準 | 100-500 | 50K-150K | 中 | 
| 優先度 | 500-1000 以降 | 150K-300K 以上 | 低 | 
+ バースト容量: ショートスパイクですべての階層で使用可能
+ ソフト制限: サービスクォータリクエストを介して増加可能
+ モデル固有: 実際の制限は基盤モデルによって異なります

### リザーブド階層の制限
<a name="reserved-tier-limits"></a>
+ 最小コミットメント: 1 モデルユニット
+ 最大単位: アカウントとリージョン固有
+ 入出力トークンの制限: 購入単位に基づく
+ 購入した容量内で RPM スロットリングがない

### バッチ処理の制限
<a name="batch-processing-limits"></a>
+ ジョブサイズ: バッチあたり最大 10,000 レコード
+ ファイルサイズ: 最大 200 MB の入力ファイル
+ 処理時間: 24 時間完了ウィンドウ
+ 同時ジョブ: リージョン固有のクォータ

### クロスリージョン推論
<a name="cross-region-inference-limits"></a>
+ リージョンごとにオンデマンド階層制限を継承します
+ 追加のクォータオーバーヘッドなし
+ 自動ルーティング (手動制限管理なし)

## コスト最適化
<a name="cost-optimization"></a>

### 決定フレームワーク
<a name="decision-framework"></a>


| シナリオ | 推奨されるオプション | なぜ | 
| --- | --- | --- | 
| 開発/テスト | Flex | 最低コスト、非本番環境でも許容可能 | 
| 標準本番稼働 | 標準 | 最高のコストパフォーマンスバランス | 
| 重要なユーザー向けアプリケーション | 優先度 | コストに対する信頼性とパフォーマンス | 
| 大量の負荷が安定している | 予約済み階層 | コミットメントによる 30～50% の節約 | 
| 一括データ処理 | バッチ | 50% 割引、緊急ではないワークロード | 
| ミッションクリティカルな稼働時間 | クロスリージョン推論 | 可用性 > コスト | 

### 最適化戦略
<a name="optimization-strategies"></a>

**適切なオンデマンド階層を選択する**
+ ほとんどのワークロードで Standard から開始する
+ 開発/テスト環境の Flex にダウングレードする
+ スロットリングがユーザーに影響する場合にのみ Priority にアップグレードする
+ CloudWatch スロットルメトリクスをモニタリングして決定事項を通知する

**リザーブド階層への移行**
+ 一貫した負荷がオンデマンドコストの 40% を超える場合
+ 損益分岐点の計算: (毎月のオンデマンドコスト) と (予約済みコミットメント)
+ 最初に 1 か月のコミットメントを使用する
+ 予約済み階層は、任意のオンデマンド階層と連携できます。

**のバッチを活用する**
+ トレーニングデータ生成
+ コンテンツモデレーションバックログ
+ レポートの生成
+ データエンリッチメントパイプライン

**アプローチを組み合わせる**
+ ベースライントラフィックの予約済み階層
+ 中程度のバーストの標準オンデマンド
+ 重要なピーク期間のオンデマンドの優先度
+ オフライン処理用のバッチ
+ フェイルオーバー専用のクロスリージョン

**コストモニタリング**
+ 階層コストの比較: Flex < Standard < Priority
+ リクエストごとにトークンを追跡する (プロンプトを最適化)
+ 使用率とスロットリングに CloudWatch メトリクスを使用する
+ 予期しないスパイクに対する請求アラームを設定する
+ リザーブド階層の使用率を毎月確認する
+ スロットリングが発生した場合にのみ階層のアップグレードを評価する

# バッチ推論を使用して複数のプロンプトを処理する
<a name="batch-inference"></a>

バッチ推論では、複数のプロンプトを送信し、非同期でレスポンスを生成できます。`InvokeModel` または `Converse` API 形式を使用して、入力データをフォーマットできます。バッチ推論は、単一のリクエストを送信し Amazon S3 バケットにレスポンスを生成することで、多数のリクエストを効率的に処理するのに役立ちます。作成するファイルでモデル入力を定義したら、ファイルを S3 バケットにアップロードします。次に、バッチ推論リクエストを送信し、S3 バケットを指定します。ジョブが完了したら、S3 から出力ファイルを取得できます。バッチ推論を使用すると、大規模なデータセットでのモデル推論のパフォーマンスを向上させることができます。

**注記**  
バッチ推論は、プロビジョニングされたモデルではサポートされていません。

バッチ推論に関する一般的な情報については、次のリソースを参照してください。
+ バッチ推論の料金については、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」を参照してください。
+ バッチ推論のクォータを確認するには、「 AWS 全般のリファレンス」の「[Amazon Bedrock endpoints and quota](https://docs.aws.amazon.com/general/latest/gr/bedrock.html)」を参照してください。
+ バッチ推論ジョブが完了したときに通知を受け取るか、ポーリングの代わりに状態を変更するには、「」を参照してください[Monitor Amazon Bedrock job state changes using Amazon EventBridgeイベントの変更をモニタリングする](monitoring-eventbridge.md)。

**Topics**
+ [バッチ推論でサポートされているリージョンおよびモデル](batch-inference-supported.md)
+ [バッチ推論の前提条件](batch-inference-prereq.md)
+ [バッチ推論ジョブを作成する](batch-inference-create.md)
+ [バッチ推論ジョブのモニタリング](batch-inference-monitor.md)
+ [バッチ推論ジョブを停止する](batch-inference-stop.md)
+ [バッチ推論ジョブの結果を表示する](batch-inference-results.md)
+ [バッチ推論のコード例](batch-inference-example.md)
+ [OpenAI Batch API を使用してプロンプトのバッチを送信する](inference-openai-batch.md)

# バッチ推論でサポートされているリージョンおよびモデル
<a name="batch-inference-supported"></a>

Amazon Bedrock でのリージョンとモデルのサポートに関する一般的な情報へのリンクは、次のリストのとおりです。
+ Amazon Bedrock でサポートされているリージョンコードとエンドポイントのリストについては、「[Amazon Bedrock endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bedrock_region)」を参照してください。
+ Amazon Bedrock API オペレーションを呼び出す際に使用する Amazon Bedrock モデル ID のリストについては、「[Amazon Bedrock でサポートされている基盤モデル](models-supported.md)」を参照してください。
+ Amazon Bedrock API オペレーションを呼び出す際に使用する Amazon Bedrock の推論プロファイル ID のリストについては、「[サポートされているクロスリージョン推論プロファイル](inference-profiles-support.md#inference-profiles-support-system)」を参照してください。

バッチ推論は、さまざまなタイプのモデルで使用できます。次のリストでは、さまざまなタイプの Amazon Bedrock モデルのサポートについて説明します。
+ **単一リージョンモデルのサポート** – 1 つのリージョンの基盤モデルへの推論リクエストの送信をサポートする AWS リージョンを一覧表示します。Amazon Bedrock で利用可能なモデルの完全な表については、「」を参照してください[Amazon Bedrock でサポートされている基盤モデル](models-supported.md)。
+ **クロスリージョン推論プロファイルのサポート** – クロスリージョン推論プロファイルの使用をサポートするリージョンを一覧表示します。クロスリージョン推論プロファイルは、地理的エリア内の複数の AWS リージョンの基盤モデルへの推論リクエストの送信をサポートします。推論プロファイルには、その地理的領域を示すモデル ID の前にプレフィックスがあります (例: `us.`、`apac`)。Amazon Bedrock で使用可能な推論プロファイルの詳細については、「」を参照してください[推論プロファイルでサポートされているリージョンおよびモデル](inference-profiles-support.md)。
+ **カスタムモデルサポート** – カスタマイズされたモデルへの推論リクエストの送信をサポートするリージョンを一覧表示します。モデルのカスタマイズの詳細については、「」を参照してください[モデルをカスタマイズしてユースケースのパフォーマンスを向上させる](custom-models.md)。

次の表は、バッチ推論のサポートをまとめたものです。


| プロバイダー | モデル | モデル ID | 単一リージョンモデルのサポート | クロスリージョン推論プロファイルのサポート | カスタムモデルのサポート | 
| --- | --- | --- | --- | --- | --- | 
| Amazon | Amazon Nova マルチモーダル埋め込み | amazon.nova-2-multimodal-embeddings-v1:0 |  us–east–1  |  | 該当なし | 
| Amazon | ノバ 2 ライト | amazon.nova-2-lite-v1:0 | 該当なし |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 ca-central-1 ca-west-1 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 il-central-1 me-central-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Amazon | Nova Lite | amazon.nova-lite-v1:0 |  me-central-1 us–east–1 us-gov-west-1  |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 ca-central-1 ca-west-1 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 il-central-1 me-central-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Amazon | Nova Micro | amazon.nova-micro-v1:0 |  us–east–1 us-gov-west-1  |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-5 ap-southeast-7 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 il-central-1 me-central-1 us–east–1 us-east-2 us-west-2  | 該当なし | 
| Amazon | Nova Premier | amazon.nova-premier-v1:0 | 該当なし |  us–east–1 us-east-2 us-west-2  | 該当なし | 
| Amazon | Nova Pro | amazon.nova-pro-v1:0 |  ap-southeast-3 me-central-1 us–east–1 us-gov-west-1  |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 il-central-1 me-central-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Amazon | Titan Multimodal Embeddings G1 | amazon.titan-embed-image-v1 |  ap-south-1 ap-southeast-2 ca-central-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  |  |  us–east–1 us-west-2  | 
| Amazon | Titan Text Embeddings V2 | amazon.titan-embed-text-v2:0 |  ap-northeast-1 ap-northeast-2 ca-central-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-2 sa-east-1 us–east–1 us-west-2  |  | 該当なし | 
| Anthropic | Claude 3 Haiku | anthropic.claude-3-haiku-20240307-v1:0 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 ca-central-1 eu-central-1 eu-central-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  | 該当なし | 該当なし | 
| Anthropic | Claude 3 Opus | anthropic.claude-3-opus-20240229-v1:0 |  us-west-2  |  us–east–1  | 該当なし | 
| Anthropic | Claude 3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0 |  ap-northeast-2 ap-south-1 ap-southeast-2 ca-central-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us–east–1 us-west-2  | 該当なし | 
| Anthropic | Claude 3.5 Haiku | anthropic.claude-3-5-haiku-20241022-v1:0 |  us-west-2  |  us–east–1  | 該当なし | 
| Anthropic | Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0 |  ap-northeast-1 ap-northeast-2 ap-southeast-1 eu-central-1 us–east–1 us-east-2 us-west-2  |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us–east–1 us-west-2  | 該当なし | 
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 |  us-west-2  |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 us–east–1 us-east-2 us-west-2  | 該当なし | 
| Anthropic | Claude 3.7 Sonnet | anthropic.claude-3-7-sonnet-20250219-v1:0 | 該当なし |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 eu-central-1 eu-north-1 eu-west-1 eu-west-3 us–east–1 us-east-2 us-west-2  | 該当なし | 
| Anthropic | Claude Haiku 4.5 | anthropic.claude-haiku-4-5-20251001-v1:0 | 該当なし |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ca-central-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Anthropic | Claude Opus 4.5 | anthropic.claude-opus-4-5-20251101-v1:0 | 該当なし |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ca-central-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Anthropic | Claude Opus 4.6 | anthropic.claude-opus-4-6-v1 | 該当なし |  af-south-1 ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 ca-central-1 ca-west-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 il-central-1 me-central-1 me-south-1 mx-central-1 sa-east-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Anthropic | Claude Sonnet 4 | anthropic.claude-sonnet-4-20250514-v1:0 | 該当なし |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 il-central-1 me-central-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Anthropic | Claude Sonnet 4.5 | anthropic.claude-sonnet-4-5-20250929-v1:0 | 該当なし |  af-south-1 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ca-central-1 ca-west-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 me-south-1 mx-central-1 sa-east-1 us–east–1 us-east-2 us-gov-east-1 us-gov-west-1 us-west-1 us-west-2  | 該当なし | 
| Anthropic | Claude Sonnet 4.6 | anthropic.claude-sonnet-4-6 |  eu-west-2  |  af-south-1 ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5 ap-southeast-7 ca-central-1 ca-west-1 eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3 il-central-1 me-central-1 me-south-1 mx-central-1 sa-east-1 us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| DeepSeek | DeepSeek V3.2 | deepseek.v3.2 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-north-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| DeepSeek | DeepSeek-V3.1 | deepseek.v3-v1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-north-1 eu-west-2 us-east-2 us-west-2  |  | 該当なし | 
| Google | Gemma 3 12B IT | google.gemma-3-12b-it |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Google | Gemma 3 27B PT | google.gemma-3-27b-it |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Google | Gemma 3 4B IT | google.gemma-3-4b-it |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Meta | Llama 3.1 405B 指示 | meta.llama3-1-405b-instruct-v1:0 |  us-west-2  |  | 該当なし | 
| Meta | Llama 3.1 70B Instruct | meta.llama3-1-70b-instruct-v1:0 |  us-west-2  |  us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.1 8B インストラクション | meta.llama3-1-8b-instruct-v1:0 |  us-west-2  |  us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.2 11B 指示 | meta.llama3-2-11b-instruct-v1:0 |  |  us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.2 1B インストラクション | meta.llama3-2-1b-instruct-v1:0 |  |  eu-central-1 eu-west-1 eu-west-3 us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.2 3B インストラクション | meta.llama3-2-3b-instruct-v1:0 |  |  eu-central-1 eu-west-1 eu-west-3 us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.2 90B 指示 | meta.llama3-2-90b-instruct-v1:0 |  |  us–east–1 us-west-2  | 該当なし | 
| Meta | Llama 3.3 70B インストラクション | meta.llama3-3-70b-instruct-v1:0 |  us-east-2  |  us–east–1 us-east-2 us-west-2  | 該当なし | 
| Meta | Llama 4 Maverick 17B Instruct | meta.llama4-maverick-17b-instruct-v1:0 |  |  us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| Meta | Llama 4 Scout 17B Instruct | meta.llama4-scout-17b-instruct-v1:0 |  |  us–east–1 us-east-2 us-west-1 us-west-2  | 該当なし | 
| MiniMax | MiniMax M2 | minimax.minimax-m2 |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| MiniMax | MiniMax M2.1 | minimax.minimax-m2.1 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | 開発 2 123B | mistral.devstral-2-123b |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | Magistral Small 2509 | mistral.magistral-small-2509 |  ap-northeast-1 ap-south-1 ap-southeast-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | 最小 14B 3.0 | mistral.ministral-3-14b-instruct |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | 最小 3 8B | mistral.ministral-3-8b-instruct |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | 最小 3B | mistral.ministral-3-3b-instruct |  ap-northeast-1 ap-south-1 ap-southeast-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | Mistral Large (24.07) | mistral.mistral-large-2407-v1:0 |  us-west-2  | 該当なし | 該当なし | 
| Mistral AI | 霧状大 3 | mistral.mistral-large-3-675b-instruct |  ap-northeast-1 ap-south-1 ap-southeast-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | Mistral Small (24.02) | mistral.mistral-small-2402-v1:0 |  us–east–1  | 該当なし | 該当なし | 
| Mistral AI | Voxtral Mini 3B 2507 | mistral.voxtral-mini-3b-2507 |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Mistral AI | Voxtral Small 24B 2507 | mistral.voxtral-small-24b-2507 |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| ムーンショット AI | Kimi K2 の考え方 | moonshot.kimi-k2- thinking |  ap-northeast-1 ap-south-1 ap-southeast-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| ムーンショット AI | Kimi K2.5 | moonshotai.kimi-k2.5 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-north-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| NVIDIA | NVIDIA Nemotron Nano 12B v2 VL BF16 | nvidia.nemotron-nano-12b-v2 |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| NVIDIA | NVIDIA Nemotron Nano 9B v2 | nvidia.nemotron-nano-9b-v2 |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| NVIDIA | Nemotron Nano 3 30B | nvidia.nemotron-nano-3-30b |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| OpenAI | GPT OSS セーフガード 120B | openai.gpt-oss-safeguard-120b |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| OpenAI | GPT OSS セーフガード 20B | openai.gpt-oss-safeguard-20b |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| OpenAI | gpt-oss-120b | openai.gpt-oss-120b-1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-gov-west-1 us-west-2  | 該当なし | 該当なし | 
| OpenAI | gpt-oss-20b | openai.gpt-oss-20b-1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-gov-west-1 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3 235B A22B 2507 | qwen.qwen3-235b-a22b-2507-v1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-2 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3 32B (高密度) | qwen.qwen3-32b-v1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3 Coder 480B A35B 命令 | qwen.qwen3-coder-480b-a35b-v1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-north-1 eu-west-2 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3 Coder 次へ | qwen.qwen3-coder-next |  ap-southeast-2 eu-west-2 us–east–1  | 該当なし | 該当なし | 
| Qwen | Qwen3 Next 80B A3B | qwen.qwen3-next-80b-a3b |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3 VL 235B A22B | qwen.qwen3-vl-235b-a22b |  ap-northeast-1 ap-south-1 ap-southeast-2 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Qwen | Qwen3-Coder-30B-A3B-Instruct | qwen.qwen3-coder-30b-a3b-v1:0 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Z.AI | GLM 4.7 | zai.glm-4.7 |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-north-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 
| Z.AI | GLM 4.7 フラッシュ | zai.glm-4.7-flash |  ap-northeast-1 ap-south-1 ap-southeast-2 ap-southeast-3 eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-2 sa-east-1 us–east–1 us-east-2 us-west-2  | 該当なし | 該当なし | 

# バッチ推論の前提条件
<a name="batch-inference-prereq"></a>

バッチ推論を実行するには、次の前提条件を満たす必要があります。

1. データセットを準備して、Amazon S3 バケットにアップロードします。

1. 出力データ用の S3 バケットを作成します。

1. 関連する IAM ID にバッチ推論関連のアクセス許可を設定します。

1. (オプション) バッチ推論の実行中に S3 内のデータを保護するために、VPC を設定します。VPC を使用する必要がない場合は、このステップをスキップできます。

これらの前提条件を満たす方法については、以降のトピックを参照してください。

**Topics**
+ [バッチ推論データをフォーマットしてアップロードする](batch-inference-data.md)
+ [バッチ推論に必要なアクセス許可](batch-inference-permissions.md)
+ [VPC を使用してバッチ推論ジョブを保護する](batch-vpc.md)

# バッチ推論データをフォーマットしてアップロードする
<a name="batch-inference-data"></a>

モデル呼び出しジョブを送信するときに選択または指定する S3 の場所にバッチ推論データを追加する必要があります。S3 の場所には、次の項目が含まれている必要があります。
+ モデル入力を定義する少なくとも 1 つの JSONL ファイル。JSONL には JSON オブジェクトの行が含まれています。JSONL ファイルは拡張子 .jsonl で終わり、次の形式である必要があります。

  ```
  { "recordId" : "alphanumeric string", "modelInput" : {JSON body} }
  ...
  ```

  各行には、 `recordId`フィールドと `modelInput`フィールドを含む JSON オブジェクトが含まれています。`modelInput` JSON オブジェクトの形式は、[バッチ推論ジョブの作成](batch-inference-create.md)時に選択するモデル呼び出しタイプによって異なります。`InvokeModel` タイプ (デフォルト) を使用する場合、形式は`InvokeModel`リクエストで使用するモデルの `body`フィールドと一致する必要があります (「」を参照[Inference request parameters and response fields for foundation models](model-parameters.md))。`Converse` タイプを使用する場合、形式は [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) API のリクエスト本文と一致する必要があります。
**注記**  
`recordId` フィールドを省略すると、Amazon Bedrock はそのフィールドを出力に追加します。
出力 JSONL ファイルのレコードの順序が入力 JSONL ファイルのレコードの順序と一致するとは限りません。
[バッチ推論ジョブ](batch-inference-create.md)を作成するときに使用するモデルを指定します。
+ (入力コンテンツに Amazon S3 の場所が含まれている場合) 一部のモデルでは、入力の内容を S3 の場所として定義できます。「[Amazon Nova のビデオ入力の例](#batch-inference-data-ex-s3)」を参照してください。
**警告**  
プロンプトで S3 URIs を使用する場合、すべてのリソースが同じ S3 バケットとフォルダに存在する必要があります。`InputDataConfig` パラメータは、個々の`.jsonl`ファイルだけでなく、リンクされたすべてのリソース (動画や画像など) を含むフォルダパスを指定する必要があります。S3 パスでは大文字と小文字が区別されるため、URIs がフォルダ構造と完全に一致することを確認してください。

入力がバッチ推論クォータに準拠していることを確認します。「[Amazon Bedrock のサービスクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)」で、次のクォータを検索できます。
+ **バッチ推論ジョブごとのレコードの最小数** – ジョブ内の JSONL ファイル全体におけるレコード (JSON オブジェクト) の最小数。
+ **バッチ推論ジョブごとの入力ファイルあたりのレコード** – ジョブ内の 1 つの JSONL ファイルにおけるレコード (JSON オブジェクト) の最大数。
+ **バッチ推論ジョブごとのレコード** – ジョブ内の JSONL ファイル全体におけるレコード (JSON オブジェクト) の最大数。
+ **バッチ推論入力ファイルのサイズ** – ジョブ内の 1 つのファイルの最大サイズ。
+ **バッチ推論ジョブのサイズ** – すべての入力ファイルの最大累積サイズ。

バッチ推論入力の設定方法に関する理解を深めるには、以下の例を参照してください。

## Anthropic Claude 3 Haiku のテキスト入力の例
<a name="batch-inference-data-ex-text"></a>

Anthropic Claude 3 Haiku モデルの [Messages API](model-parameters-anthropic-claude-messages.md) 形式を使用してバッチ推論を実行する場合は、次の JSON オブジェクトを含む JSONL ファイルを行の 1 つとして指定できます。

```
{
    "recordId": "CALL0000001", 
    "modelInput": {
        "anthropic_version": "bedrock-2023-05-31", 
        "max_tokens": 1024,
        "messages": [ 
            { 
                "role": "user", 
                "content": [
                    {
                        "type": "text", 
                        "text": "Summarize the following call transcript: ..." 
                    } 
                ]
            }
        ]
    }
}
```

## Amazon Nova のビデオ入力の例
<a name="batch-inference-data-ex-s3"></a>

Amazon Nova Lite または Amazon Nova Pro モデルを使用してビデオ入力でバッチ推論を実行する場合は、ビデオをバイト単位で定義するか、JSONL ファイル内の S3 の場所として定義するかを選択できます。例えば、パスが `s3://batch-inference-input-bucket` で、次のファイルが含まれている S3 バケットがあるとします。

```
s3://batch-inference-input-bucket/
├── videos/
│   ├── video1.mp4
│   ├── video2.mp4
│   ├── ...
│   └── video50.mp4
└── input.jsonl
```

`input.jsonl` ファイルのサンプルレコードは次のようになります。

```
{
    "recordId": "RECORD01",
    "modelInput": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "You are an expert in recipe videos. Describe this video in less than 200 words following these guidelines: ..."
                    },
                    {
                        "video": {
                            "format": "mp4",
                            "source": {
                                "s3Location": {
                                    "uri": "s3://batch-inference-input-bucket/videos/video1.mp4",
                                    "bucketOwner": "111122223333"
                                }
                            }
                        }
                    }
                ]
            }
        ]
    }
}
```

バッチ推論ジョブを作成するときは、 `InputDataConfig`パラメータ`s3://batch-inference-input-bucket`でフォルダパスを指定する必要があります。バッチ推論は、参照されるリソース (`videos`サブフォルダ内のビデオファイルなど) とともに、この場所で`input.jsonl`ファイルを処理します。

以下のリソースでは、バッチ推論用のビデオ入力の送信について詳しく説明しています。
+ 入力リクエストで Amazon S3 URIs を検証する方法については、[Amazon S3 URL 解析ブログ](https://aws.amazon.com/blogs/devops/s3-uri-parsing-is-now-available-in-aws-sdk-for-java-2-x/)を参照してください。
+ Nova でのビデオ理解のための呼び出しレコードの設定方法の詳細については、[Amazon Nova「ビジョンプロンプトガイドライン](https://docs.aws.amazon.com/nova/latest/userguide/prompting-vision-prompting.html)」を参照してください。

## Converse 入力の例
<a name="batch-inference-data-ex-converse"></a>

バッチ推論ジョブの作成`Converse`時にモデル呼び出しタイプを に設定した場合、 `modelInput`フィールドは Converse API リクエスト形式を使用する必要があります。次の例は、Converse バッチ推論ジョブの JSONL レコードを示しています。

```
{
    "recordId": "CALL0000001",
    "modelInput": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "Summarize the following call transcript: ..."
                    }
                ]
            }
        ],
        "inferenceConfig": {
            "maxTokens": 1024
        }
    }
}
```

Converse リクエスト本文でサポートされているフィールドの完全なリストについては、 API リファレンスの[「Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)」を参照してください。

次のトピックでは、アイデンティティがバッチ推論を実行できるように S3 へのアクセスとバッチ推論のアクセス許可を設定する方法について説明します。

# バッチ推論に必要なアクセス許可
<a name="batch-inference-permissions"></a>

バッチ推論を実行するには、次の IAM アイデンティティのアクセス許可を設定する必要があります。
+ バッチ推論ジョブを作成および管理する IAM アイデンティティ。
+ Amazon Bedrock がユーザーに代わってアクションを実行するために引き受けるバッチ推論[サービスロール](security-iam-sr.md)。

各アイデンティティのアクセス許可を設定する方法については、以下のトピックを参照してください。

**Topics**
+ [IAM アイデンティティがバッチ推論ジョブを送信および管理するために必要なアクセス許可](#batch-inference-permissions-user)
+ [サービスロールがバッチ推論を実行するために必要なアクセス許可](#batch-inference-permissions-service)

## IAM アイデンティティがバッチ推論ジョブを送信および管理するために必要なアクセス許可
<a name="batch-inference-permissions-user"></a>

IAM アイデンティティがこの機能を使用するには、必要なアクセス許可でアイデンティティを設定する必要があります。これを行うには、次のいずれかを実行します。
+ アイデンティティがすべての Amazon Bedrock アクションを実行できるようにするには、[AmazonBedrockFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonBedrockFullAccess) ポリシーをアイデンティティにアタッチします。これを行う場合は、このトピックをスキップできます。このオプションの方が安全性は低くなります。
+ セキュリティのベストプラクティスとして、必要なアクションのみをアイデンティティに付与する必要があります。このトピックでは、この機能に必要なアクセス許可について説明します。

バッチ推論に使用されるアクションにのみアクセス許可を制限するには、次のアイデンティティベースのポリシーを IAM アイデンティティにアタッチします。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "BatchInference",
            "Effect": "Allow",
            "Action": [  
                "bedrock:ListFoundationModels",
                "bedrock:GetFoundationModel",
                "bedrock:ListInferenceProfiles",
                "bedrock:GetInferenceProfile",
                "bedrock:ListCustomModels",
                "bedrock:GetCustomModel",
                "bedrock:TagResource", 
                "bedrock:UntagResource", 
                "bedrock:ListTagsForResource",
                "bedrock:CreateModelInvocationJob",
                "bedrock:GetModelInvocationJob",
                "bedrock:ListModelInvocationJobs",
                "bedrock:StopModelInvocationJob"
            ],
            "Resource": "*"
        }
    ]   
}
```

------

アクセス許可をさらに制限するには、アクションを省略するか、アクセス許可をフィルタリングするためのリソースや条件キーを指定できます。アクション、リソース、条件キーの詳細については、「*サービス認可リファレンス*」の以下のトピックを参照してください。
+ [Amazon Bedrock で定義されるアクション](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-actions-as-permissions) – アクション、`Resource` フィールドで範囲を定義できるリソースタイプ、`Condition` フィールドでアクセス許可をフィルタリングできる条件キーについて説明しています。
+ [Amazon Bedrock で定義されるリソースタイプ](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies) – Amazon Bedrock のリソースタイプについて説明しています。
+ [Amazon Bedrock の条件キー](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-policy-keys) – Amazon Bedrock の条件キーについて説明しています。

次のポリシーは、バッチ推論のアクセス許可の範囲を絞り込み、Anthropic Claude 3 Haiku モデルを使用して、アカウント ID `123456789012` のユーザーが `us-west-2` リージョンでバッチ推論ジョブを作成することだけを許可する例です。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "CreateBatchInferenceJob",
            "Effect": "Allow",
            "Action": [
                "bedrock:CreateModelInvocationJob"
            ],
            "Resource": [
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0",
                "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*"
            ]
        }
    ]
}
```

------

## サービスロールがバッチ推論を実行するために必要なアクセス許可
<a name="batch-inference-permissions-service"></a>

バッチ推論は、ユーザーに代わってアクションを実行するためにユーザーのアイデンティティを引き受ける[サービスロール](security-iam-sr.md)によって実行されます。サービスロールは、以下の方法で作成できます。
+ Amazon Bedrock が AWS マネジメントコンソールを使用して、必要なアクセス許可を持つサービスロールを自動的に作成できるようにします。このオプションは、バッチ推論ジョブを作成するときに選択できます。
+ を使用して Amazon Bedrock のカスタムサービスロールを作成しAWS Identity and Access Management、必要なアクセス許可をアタッチします。バッチ推論ジョブを送信するときは、このロールを指定します。バッチ推論用のカスタムサービスロールの作成の詳細については、「[バッチ推論向けのサービスロールを作成する](batch-iam-sr.md)」を参照してください。サービスロールの作成に関する一般的な情報については、「IAM ユーザーガイド」の「[AWS のサービスにアクセス許可を委任するロールを作成する](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles_create_for-service.html)」を参照してください。

**重要**  
[バッチ推論用にデータをアップロード](batch-inference-data.md)した S3 バケットが別の にある場合はAWS アカウント、サービスロールにデータへのアクセスを許可するように S3 バケットポリシーを設定する必要があります。コンソールを使用してサービスロールを自動的に作成する場合にも、このポリシーを手動で設定する必要があります。Amazon Bedrock リソースの S3 バケットポリシーを設定する方法については、「[バケットポリシーを Amazon S3 バケットにアタッチして、別のアカウントにバケットポリシーへのアクセスを許可する](s3-bucket-access.md#s3-bucket-access-cross-account)」を参照してください。
Amazon Bedrock の基盤モデルはAWS、顧客の所有権を必要とする IAM ポリシー条件では使用できないマネージドリソースです。これらのモデルは によって所有および運用されておりAWS、個々のお客様が所有することはできません。顧客所有のリソース (リソースタグ、組織 ID、またはその他の所有権属性を使用する条件など) をチェックする IAM ポリシー条件は、基盤モデルに適用すると失敗し、これらのサービスへの正当なアクセスがブロックされる可能性があります。  
たとえば、ポリシーに次のような`aws:ResourceOrgID`条件が含まれている場合:  

  ```
  {
    "Condition": {
      "StringEqualsIgnoreCase": {
        "aws:ResourceOrgID": ["o-xxxxxxxx"]
      }
    }
  }
  ```
バッチ推論ジョブは で失敗します`AccessDeniedException`。`aws:ResourceOrgID` 条件を削除するか、基盤モデルの個別のポリシーステートメントを作成します。

# VPC を使用してバッチ推論ジョブを保護する
<a name="batch-vpc"></a>

バッチ推論ジョブを実行すると、ジョブは Amazon S3 バケットにアクセスして入力データをダウンロードし、出力データを書き込みます。データへのアクセスを制御するには、[Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/what-is-amazon-vpc.html) で仮想プライベートクラウド (VPC) を使用することをお勧めします。データをインターネット経由で利用できないように VPC を設定し、代わりに [AWS PrivateLink](https://docs.aws.amazon.com/vpc/latest/privatelink/what-is-privatelink.html) で VPC インターフェイスエンドポイントを作成してデータへのプライベート接続を確立することで、データをさらに保護することができます。Amazon VPC と Amazon Bedrock AWS PrivateLink の統合方法の詳細については、「」を参照してください[Amazon VPC と AWS PrivateLink を使用してデータを保護する](usingVPC.md)。

バッチ推論ジョブの入力プロンプトと出力モデルレスポンスに VPC を設定して使用するには、次の手順を実行します。

**Topics**
+ [バッチ推論中にデータを保護するために VPC を設定する](#batch-vpc-setup)
+ [VPC アクセス許可をバッチ推論ロールにアタッチする](#batch-vpc-role)
+ [バッチ推論ジョブを送信する際に VPC 設定を追加する](#batch-vpc-config)

## バッチ推論中にデータを保護するために VPC を設定する
<a name="batch-vpc-setup"></a>

VPC をセットアップするには、「[VPC をセットアップする](usingVPC.md#create-vpc)」の手順に従います。S3 の VPC エンドポイントを設定し、リソースベースの IAM ポリシーを使用してバッチ推論データを含む S3 バケットへのアクセスを制限することで、VPC をさらに保護するには、「[(例) VPC を使用して Amazon S3 データへのデータアクセスを制限する](vpc-s3.md)」の手順に従います。

## VPC アクセス許可をバッチ推論ロールにアタッチする
<a name="batch-vpc-role"></a>

VPC のセットアップが完了したら、次のアクセス許可を[バッチ推論サービスロール](batch-iam-sr.md)にアタッチして、VPC へのアクセスを許可します。このポリシーを変更して、ジョブに必要な VPC リソースのみへのアクセスを許可します。*subnet-ids* と *security-group-id* を VPC からの値で置き換えます。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Sid": "1",
            "Effect": "Allow",
            "Action": [
                "ec2:DescribeNetworkInterfaces",
                "ec2:DescribeVpcs",
                "ec2:DescribeDhcpOptions",
                "ec2:DescribeSubnets",
                "ec2:DescribeSecurityGroups"
            ],
            "Resource": [
                "*"
            ]
        },
        {
            "Sid": "2",
            "Effect": "Allow",
            "Action": [
                "ec2:CreateNetworkInterface"
            ],
            "Resource": [
                "arn:aws:ec2:us-east-1:123456789012:network-interface/*",
                "arn:aws:ec2:us-east-1:123456789012:subnet/${{subnet-id}}",
                "arn:aws:ec2:us-east-1:123456789012:security-group/${{security-group-id}}"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/BedrockManaged": [
                        "true"
                    ]
                },
                "ArnEquals": {
                    "aws:RequestTag/BedrockModelInvocationJobArn": [
                        "arn:aws:bedrock:us-east-1:123456789012:model-invocation-job/*"
                    ]
                }
            }
        },
        {
            "Sid": "3",
            "Effect": "Allow",
            "Action": [
                "ec2:CreateNetworkInterfacePermission",
                "ec2:DeleteNetworkInterface",
                "ec2:DeleteNetworkInterfacePermission"
            ],
            "Resource": [
                "*"
            ],
            "Condition": {
                "StringEquals": {
                    "ec2:Subnet": [
                        "arn:aws:ec2:us-east-1:123456789012:subnet/${{subnet-id}}"
                    ]
                },
                "ArnEquals": {
                    "ec2:ResourceTag/BedrockModelInvocationJobArn": [
                        "arn:aws:bedrock:us-east-1:123456789012:model-invocation-job/*"
                    ]
                }
            }
        },
        {
            "Sid": "4",
            "Effect": "Allow",
            "Action": [
                "ec2:CreateTags"
            ],
            "Resource": "arn:aws:ec2:us-east-1:123456789012:network-interface/*",
            "Condition": {
                "StringEquals": {
                    "ec2:CreateAction": [
                        "CreateNetworkInterface"
                    ]
                },
                "ForAllValues:StringEquals": {
                    "aws:TagKeys": [
                        "BedrockManaged",
                        "BedrockModelInvocationJobArn"
                    ]
                }
            }
        }
    ]
}
```

------

## バッチ推論ジョブを送信する際に VPC 設定を追加する
<a name="batch-vpc-config"></a>

これまでのセクションの手順に従って VPC および必要なロールとアクセス許可を設定し終わったら、この VPC を使用するバッチ推論ジョブを作成することができます。

**注記**  
現在、バッチ推論ジョブを作成する際は、API を介してのみ VPC を使用できます。

ジョブの VPC サブネットとセキュリティグループを指定すると、Amazon Bedrock はサブネットの 1 つのセキュリティグループに関連付けられた *Elastic Network Interface* (ENI) を作成します。ENI により、Amazon Bedrock ジョブは VPC 内のリソースに接続できます。ENI については、「*Amazon VPC ユーザーガイド*」の「[Elastic Network Interfaces](https://docs.aws.amazon.com/vpc/latest/userguide/VPC_ElasticNetworkInterfaces.html)」を参照してください。Amazon Bedrock は、作成した ENI に `BedrockManaged` および `BedrockModelInvocationJobArn` タグを付けます。

アベイラビリティーゾーンごとに少なくとも 1 つのサブネットを指定することをお勧めします。

セキュリティグループを使用すると、VPC リソースへの Amazon Bedrock のアクセスを制御するためのルールを設定できます。

[CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) リクエストを送信する際、次の例のように、`VpcConfig` をリクエストパラメータとして含めて、使用する VPC サブネットとセキュリティグループを指定できます。

```
"vpcConfig": { 
    "securityGroupIds": [
        "sg-0123456789abcdef0"
    ],
    "subnets": [
        "subnet-0123456789abcdef0",
        "subnet-0123456789abcdef1",
        "subnet-0123456789abcdef2"
    ]
}
```

# バッチ推論ジョブを作成する
<a name="batch-inference-create"></a>

モデル推論を実行するためのファイルを含む Amazon S3 バケットを設定したら、バッチ推論ジョブを作成できます。開始する前に、「[バッチ推論データをフォーマットしてアップロードする](batch-inference-data.md)」で説明されている手順に従ってファイルをセットアップしていることを確認してください。

**注記**  
VPC を使用してバッチ推論ジョブを送信するには、 API を使用する必要があります。VPC 設定を含める方法については、API タブを選択してください。

バッチ推論ジョブを作成する方法については、任意の方法のタブを選択し、手順に従います。

------
#### [ Console ]

**バッチ推論ジョブを作成するには**

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソール を使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで、**[バッチ推論]** を選択します。

1. **[バッチ推論ジョブ]** セクションで、**[ジョブの作成]** を選択します。

1. **[ジョブの詳細]** セクションで、バッチ推論ジョブに **[ジョブ名]** を指定し、**[モデルの選択]** を選択してバッチ推論ジョブに使用するモデルを選択します。

1. **モデル呼び出しタイプ**セクションで、入力データの API 形式を選択します。入力データがモデル固有のリクエスト形式を使用している場合は **InvokeModel** を選択し、入力データが **Converse** API 形式を使用している場合は Converse を選択します。デフォルトは **InvokeModel** です。

1. **[入力データ]** セクションで、**[S3 を参照]** を選択し、バッチ推論ジョブの S3 の場所を選択します。バッチ推論では、場所が S3 フォルダであるか単一の JSONL ファイルであるかにかかわらず、その S3 の場所にあるすべての JSONL および付随するコンテンツファイルが処理されます。
**注記**  
入力データが、ジョブの送信元のアカウントとは異なるアカウントに属する S3 バケットにある場合は、API を使用してバッチ推論ジョブを送信する必要があります。この方法については、上の API タブを選択してください。

1. **出力データ**セクションで、**S3 を参照**を選択し、バッチ推論ジョブから出力ファイルを保存する S3 の場所を選択します。デフォルトでは、出力データは によって暗号化されます AWS マネージドキー。カスタム KMS キーを選択するには、**[暗号化設定のカスタマイズ (アドバンスト)]** を選択し、キーを選択します。Amazon Bedrock リソースの暗号化とカスタム KMS キーの設定の詳細については、「[データ暗号化](data-encryption.md)」を参照してください。
**注記**  
ジョブの送信元のアカウントとは異なるアカウントに属する S3 バケットに出力データを保存する場合は、API を使用してバッチ推論ジョブを送信する必要があります。この方法については、上の API タブを選択してください。

1. **[サービスアクセス]** セクションで、次のいずれかのオプションを選択します。
   + **既存のサービスロールを使用** - ドロップダウンリストからサービスロールを選択します。適切なアクセス許可を持つカスタムロールをセットアップする方法の詳細については、「[バッチ推論に必要なアクセス許可](batch-inference-permissions.md)」を参照してください。
   + **新しいサービスロールを作成して使用** - サービスロールの名前を入力します。

1. (オプション) タグをバッチ推論ジョブに関連付けるには、**[タグ]** セクションを展開し、タグごとにキーとオプションの値を追加します。詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。

1. [**Create batch inference job (バッチ推論ジョブの作成)**] を選択します。

------
#### [ API ]

バッチ推論ジョブを作成するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) リクエストを送信します。

以下のフィールドが必要です。


****  

| フィールド | ユースケース | 
| --- | --- | 
| jobName | ジョブの名前を指定します。 | 
| roleArn | ジョブを作成および管理するためのアクセス許可を持つサービスロールの Amazon リソースネーム (ARN) を指定します。詳細については、「[バッチ推論向けのサービスロールを作成する](batch-iam-sr.md)」を参照してください。 | 
| modelId | 推論で使用するモデルの ID または ARN を指定します。 | 
| inputDataConfig | 入力データを含む S3 の場所を指定します。バッチ推論では、場所が S3 フォルダであるか単一の JSONL ファイルであるかにかかわらず、その S3 の場所にあるすべての JSONL および付随するコンテンツファイルが処理されます。詳細については、「[バッチ推論データをフォーマットしてアップロードする](batch-inference-data.md)」を参照してください。 | 
| outputDataConfig | モデルレスポンスを書き込む S3 の場所を指定します。 | 

次のフィールドはオプションです。


****  

| フィールド | ユースケース | 
| --- | --- | 
| modelInvocationType | 入力データの API 形式を指定するには。Converse API 形式Converseを使用するには を、モデル固有のリクエスト形式を使用するには InvokeModel (デフォルト) に設定します。Converse リクエスト形式の詳細については、[「Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)」を参照してください。 | 
| timeoutDurationInHours | ジョブがタイムアウトするまでの時間を指定します。 | 
| tags | ジョブに関連付けるタグを指定します。詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。 | 
| vpcConfig | ジョブでデータを保護するために使用する VPC 設定を指定します。詳細については、「[VPC を使用してバッチ推論ジョブを保護する](batch-vpc.md)」を参照してください。 | 
| clientRequestToken | API リクエストが 1 回だけ完了するようにします。詳細については、「[べき等性の確保](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html)」を参照してください。 | 

レスポンスは `jobArn` を返します。ユーザーはこれを使用して、バッチ推論に関連する別の API コールを実行する際にジョブを参照できます。

------

# バッチ推論ジョブのモニタリング
<a name="batch-inference-monitor"></a>

バッチ推論ジョブの設定に加えて、バッチ推論ジョブのステータスを表示して進捗状況をモニタリングすることもできます。ジョブが取り得るステータスの詳細については、[ModelInvocationJobSummary](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ModelInvocationJobSummary.html) の `status` フィールドを参照してください。

また、処理済みのレコードの数とレコードの合計数を比較して、ジョブのステータスを追跡することもできます。これらの数値は、出力ファイルを含む Amazon S3 バケットの `manifest.json.out` ファイルにあります。詳細については、「[バッチ推論ジョブの結果を表示する](batch-inference-results.md)」を参照してください。S3 オブジェクトのダウンロード方法については、「[オブジェクトのダウンロード](https://docs.aws.amazon.com/AmazonS3/latest/userguide/download-objects.html)」を参照してください。

**ヒント**  
ジョブステータスをポーリングする代わりに、Amazon EventBridge を使用して、バッチ推論ジョブの完了時または状態の変更時に自動通知を受け取ることができます。詳細については、「[Monitor Amazon Bedrock job state changes using Amazon EventBridgeイベントの変更をモニタリングする](monitoring-eventbridge.md)」を参照してください。

バッチ推論ジョブの詳細を表示する方法については、使用する方法に対応するタブを選択して、手順に従ってください。

------
#### [ Console ]

**バッチ推論ジョブに関する情報を表示するには**

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソール を使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで、**[バッチ推論]** を選択します。

1. **[バッチ推論ジョブ]** セクションで、ジョブを選択します。

1. ジョブの詳細ページでジョブの設定に関する情報を表示し、**[ステータス]** を表示してその進行状況をモニタリングできます。

------
#### [ API ]

バッチ推論ジョブに関する情報を取得するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[GetModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetModelInvocationJob.html) リクエストを送信します。`jobIdentifier` フィールドには、ジョブの ID または ARN を指定します。

複数のバッチ推論ジョブについての情報を一覧表示するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[ListModelInvocationJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListModelInvocationJobs.html) を送信します。以下のオプションパラメータを指定できます。

`GetModelInvocationJob` および のレスポンスには、ジョブが `InvokeModel`または `Converse` API 形式を使用するかどうかを示す`modelInvocationType`フィールド`ListModelInvocationJobs`が含まれています。


****  

| フィールド | 簡単な説明 | 
| --- | --- | 
| maxResults | レスポンスとして返す結果の最大数。 | 
| nextToken | maxResults フィールドで指定した数よりも結果の件数が多い場合は、レスポンスで nextToken 値が返されます。結果の次のバッチを表示するには、別のリクエストで nextToken 値を送信します。 | 

ジョブのすべてのタグを一覧表示するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[ListTagsForResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListTagsForResource.html) リクエストをジョブの Amazon リソースネーム (ARN) を含めて送信します。

------

# バッチ推論ジョブを停止する
<a name="batch-inference-stop"></a>

進行中のバッチ推論ジョブを停止する方法については、使用する方法に対応するタブを選択して、手順に従ってください。

------
#### [ Console ]

**バッチ推論ジョブを停止するには**

1. Amazon Bedrock コンソールを使用するためのアクセス許可を持つ IAM ID を使用して、AWS マネジメントコンソールにサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで、**[バッチ推論]** を選択します。

1. ジョブを選択してジョブの詳細ページに移動するか、ジョブの横にあるオプションボタンを選択します。

1. **[ジョブを停止]** を選択します。

1. メッセージを確認して、**[ジョブを停止]** を選択して承認します。
**注記**  
既に処理されているトークンには料金がかかります。

------
#### [ API ]

バッチ推論ジョブを停止するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[StopModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_StopModelInvocationJob.html) リクエストを送信します。`jobIdentifier` フィールドには、ジョブの ID または ARN を指定します。

ジョブが正常に停止すると、HTTP 200 レスポンスを受け取ります。

------

# バッチ推論ジョブの結果を表示する
<a name="batch-inference-results"></a>

バッチ推論ジョブが `Completed` になったら、ジョブの作成時に指定した Amazon S3 バケット内のファイルからバッチ推論ジョブの結果を抽出できます。S3 オブジェクトのダウンロード方法については、「[オブジェクトのダウンロード](https://docs.aws.amazon.com/AmazonS3/latest/userguide/download-objects.html)」を参照してください。S3 バケットには以下のファイルが含まれています。

1. Amazon Bedrock は入力 JSONL ファイルごとに出力 JSONL ファイルを生成します。出力ファイルには、各入力のモデルからの出力が次の形式で含まれます。推論でエラーが発生した行の `modelOutput` フィールドは `error` オブジェクトに置き換わります。`modelOutput` JSON オブジェクトの形式は、モデルの呼び出しタイプによって異なります。`InvokeModel` ジョブの場合、形式は`InvokeModel`レスポンスの `body`フィールドと一致します (「」を参照[Inference request parameters and response fields for foundation models](model-parameters.md))。`Converse` ジョブの場合、 形式は [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) API のレスポンス本文と一致します。

   ```
   { "recordId" : "string", "modelInput": {JSON body}, "modelOutput": {JSON body} }
   ```

   次の例は、可能な出力ファイルを示しています。

   ```
   { "recordId" : "3223593EFGH", "modelInput" : {"inputText": "Roses are red, violets are"}, "modelOutput" : {"inputTextTokenCount": 8, "results": [{"tokenCount": 3, "outputText": "blue\n", "completionReason": "FINISH"}]}}
   { "recordId" : "1223213ABCD", "modelInput" : {"inputText": "Hello world"}, "error" : {"errorCode" : 400, "errorMessage" : "bad request" }}
   ```

1. バッチ推論ジョブの要約を含む `manifest.json.out` ファイル。

   ```
   {
       "totalRecordCount" : number, 
       "processedRecordCount" : number,
       "successRecordCount": number,
       "errorRecordCount": number,
       "inputTokenCount": number,
       "outputTokenCount" : number
   }
   ```

   各フィールドについて以下に説明します。
   + totalRecordCount – バッチ推論ジョブに送信されたレコードの合計数。
   + processedRecordCount – バッチ推論ジョブで処理されたレコードの数。
   + successRecordCount – バッチ推論ジョブによって正常に処理されたレコードの数。
   + errorRecordCount – エラーの原因となったバッチ推論ジョブ内のレコードの数。
   + inputTokenCount – バッチ推論ジョブに送信された入力トークンの合計数。
   + outputTokenCount – バッチ推論ジョブによって生成された出力トークンの合計数。

# バッチ推論のコード例
<a name="batch-inference-example"></a>

この章のコード例では、バッチ推論ジョブを作成し、その情報を表示して停止する方法を説明しています。この例では、 `InvokeModel` API 形式を使用します。`Converse` API 形式の使用の詳細については、「」を参照してください[バッチ推論データをフォーマットしてアップロードする](batch-inference-data.md)。

言語を選択すると、コードの例が表示されます。

------
#### [ Python ]

*abc.jsonl* という名前の JSONL ファイルを作成し、各レコードに少なくとも最小レコード数 (「[Amazon Bedrock のクォータ](quotas.md)」で ***\$1Model\$1* のバッチ推論ジョブあたりの最小レコード数**を参照) がある JSON オブジェクトを含めます。この例では、Anthropic Claude 3 Haiku モデルを使用します。次の例は、ファイル内の最初の入力 JSON を示しています。

```
{
    "recordId": "CALL0000001", 
    "modelInput": {
        "anthropic_version": "bedrock-2023-05-31", 
        "max_tokens": 1024,
        "messages": [ 
            { 
                "role": "user", 
                "content": [
                    {
                        "type": "text", 
                        "text": "Summarize the following call transcript: ..." 
                    } 
                ]
            }
        ]
    }
}
... 
# Add records until you hit the minimum
```

*amzn-s3-demo-bucket-input* という名前の S3 バケットを作成し、そのバケットにファイルをアップロードします。次に、*amzn-s3-demo-bucket-output* という名前の S3 バケットを作成して、出力ファイルを書き込みます。次のコードスニペットを実行してジョブを送信し、レスポンスから *jobArn* を取得します。

```
import boto3

bedrock = boto3.client(service_name="bedrock")

inputDataConfig=({
    "s3InputDataConfig": {
        "s3Uri": "s3://amzn-s3-demo-bucket-input/abc.jsonl"
    }
})

outputDataConfig=({
    "s3OutputDataConfig": {
        "s3Uri": "s3://amzn-s3-demo-bucket-output/"
    }
})

response=bedrock.create_model_invocation_job(
    roleArn="arn:aws:iam::123456789012:role/MyBatchInferenceRole",
    modelId="anthropic.claude-3-haiku-20240307-v1:0",
    jobName="my-batch-job",
    inputDataConfig=inputDataConfig,
    outputDataConfig=outputDataConfig
)

jobArn = response.get('jobArn')
```

ジョブの `status` を返します。

```
bedrock.get_model_invocation_job(jobIdentifier=jobArn)['status']
```

*失敗した*バッチ推論ジョブを一覧表示します。

```
bedrock.list_model_invocation_jobs(
    maxResults=10,
    statusEquals="Failed",
    sortOrder="Descending"
)
```

開始したジョブを停止します。

```
bedrock.stop_model_invocation_job(jobIdentifier=jobArn)
```

------

# OpenAI Batch API を使用してプロンプトのバッチを送信する
<a name="inference-openai-batch"></a>

Amazon Bedrock OpenAI モデルで [OpenAI Create batch API](https://platform.openai.com/docs/api-reference/batch) を使用してバッチ推論ジョブを実行できます。

以下の方法で OpenAI Create batch API を呼び出すことができます。
+ Amazon Bedrock ランタイムエンドポイントを使用して HTTP リクエストを行う。
+ Amazon Bedrock ランタイムエンドポイントで OpenAI SDK リクエストを使用する。

詳細情報については、トピックを選択してください。

**Topics**
+ [OpenAI batch API でサポートされているモデルとリージョン](#inference-openai-batch-supported)
+ [OpenAI batch API を使用するための前提条件](#inference-openai-batch-prereq)
+ [OpenAI バッチジョブを作成する](#inference-openai-batch-create)
+ [OpenAI バッチジョブを取得する](#inference-openai-batch-retrieve)
+ [OpenAI バッチジョブの一覧表示](#inference-openai-batch-list)
+ [OpenAI バッチジョブをキャンセルする](#inference-openai-batch-cancel)

## OpenAI batch API でサポートされているモデルとリージョン
<a name="inference-openai-batch-supported"></a>

OpenAI Create batch API は、Amazon Bedrock およびこれらのOpenAIモデルをサポートする AWS リージョンでサポートされているすべてのモデルで使用できます。サポートされているモデルとリージョンの詳細については、「[Amazon Bedrock でサポートされている基盤モデル](models-supported.md)」を参照してください。

## OpenAI batch API を使用するための前提条件
<a name="inference-openai-batch-prereq"></a>

OpenAI batch API オペレーションを使用するための前提条件を確認するには、任意の方法のタブを選択し、ステップに従います。

------
#### [ OpenAI SDK ]
+ **認証** – OpenAI SDK は Amazon Bedrock API キーを使用した認証のみをサポートします。Amazon Bedrock API キーを生成してリクエストを認証します。Amazon Bedrock API キーとその生成方法については、「ビルド」章の「API キー」セクションを参照してください。
+ **エンドポイント** – Amazon Bedrock ランタイムエンドポイントとクォータで使用する AWS リージョンに対応するエンドポイントを見つけます。 [https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt) AWS SDK を使用する場合は、クライアントの設定時にエンドポイント全体ではなく、リージョンコードを指定するだけで済みます。
+ **モデルアクセス** – この機能をサポートする Amazon Bedrock モデルへのアクセスをリクエストします。詳細については、「[SDK と CLI を使用してモデルアクセスを管理する](model-access.md#model-access-modify)」を参照してください。
+ **OpenAI SDK のインストール** – 詳細については、「OpenAI ドキュメント」の「[ライブラリ](https://platform.openai.com/docs/libraries)」を参照してください。
+ **S3 にアップロードされたバッチ JSONL ファイル** – 「OpenAI ドキュメント」の「[バッチファイルの準備](https://platform.openai.com/docs/guides/batch#1-prepare-your-batch-file)」の手順に従って、バッチファイルを正しい形式で準備します。これを Amazon S3 バケットにアップロードします。
+ **IAM アクセス許可** – 適切なアクセス許可を持つ次の IAM ID があることを確認します。
  + 認証で使用する IAM ID では、バッチ推論関連の API オペレーションを実行できます。詳細については、「[IAM アイデンティティがバッチ推論ジョブを送信および管理するために必要なアクセス許可](batch-inference-permissions.md)」を参照してください。
  + 使用するバッチ推論サービスロールは、ID を引き受け、使用する OpenAI モデルを呼び出し、S3 のバッチ JSONL ファイルにアクセスできます。詳細については、「[サービスロール](security-iam-sr.md)」を参照してください。

------
#### [ HTTP request ]
+ **認証** – AWS 認証情報または Amazon Bedrock API キーを使用して認証できます。

   AWS 認証情報を設定するか、Amazon Bedrock API キーを生成してリクエストを認証します。
  +  AWS 認証情報の設定については、[AWS 「セキュリティ認証情報を使用したプログラムによるアクセス](https://docs.aws.amazon.com/IAM/latest/UserGuide/security-creds-programmatic-access.html)」を参照してください。
  + Amazon Bedrock API キーとその生成方法については、「ビルド」章の「API キー」セクションを参照してください。
+ **エンドポイント** – Amazon Bedrock ランタイムエンドポイントとクォータで使用する AWS リージョンに対応するエンドポイントを見つけます。 [https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt) AWS SDK を使用する場合は、クライアントの設定時にエンドポイント全体ではなく、リージョンコードを指定するだけで済みます。
+ **モデルアクセス** – この機能をサポートする Amazon Bedrock モデルへのアクセスをリクエストします。詳細については、「[SDK と CLI を使用してモデルアクセスを管理する](model-access.md#model-access-modify)」を参照してください。
+ **S3 にアップロードされたバッチ JSONL ファイル** – 「OpenAI ドキュメント」の「[バッチファイルの準備](https://platform.openai.com/docs/guides/batch#1-prepare-your-batch-file)」の手順に従って、バッチファイルを正しい形式で準備します。これを Amazon S3 バケットにアップロードします。
+ **IAM アクセス許可** – 適切なアクセス許可を持つ次の IAM ID があることを確認します。
  + 認証で使用する IAM ID では、バッチ推論関連の API オペレーションを実行できます。詳細については、「[IAM アイデンティティがバッチ推論ジョブを送信および管理するために必要なアクセス許可](batch-inference-permissions.md)」を参照してください。
  + 使用するバッチ推論サービスロールは、ID を引き受け、使用する OpenAI モデルを呼び出し、S3 のバッチ JSONL ファイルにアクセスできます。詳細については、「[サービスロール](security-iam-sr.md)」を参照してください。

------

## OpenAI バッチジョブを作成する
<a name="inference-openai-batch-create"></a>

OpenAI Create batch API の詳細については、「OpenAI ドキュメント」の以下のリソースを参照してください。
+ [バッチの作成](https://platform.openai.com/docs/api-reference/batch/create) – リクエストとレスポンスの両方の詳細を表示します。
+ [リクエスト出力オブジェクト](https://platform.openai.com/docs/api-reference/batch/request-output) – バッチジョブから生成された出力のフィールドの詳細を表示します。S3 バケットで結果を解釈する場合は、このドキュメントを参照してください。

**リクエストを形成する**  
バッチ推論リクエストを形成するときは、次の Amazon Bedrock 固有のフィールドと値に注意してください。

**リクエストヘッダー**
+ X-Amzn-Bedrock-RoleArn (必須) – バッチ推論サービスロールの Amazon リソースネーム (ARN)。詳細については、[バッチ推論向けのサービスロールを作成する](batch-iam-sr.md)を参照してください。
+ X-Amzn-Bedrock-ModelId (必須) – 推論で使用する基盤モデルの ID。詳細については、「[Amazon Bedrock でサポートされている基盤モデル](models-supported.md)」を参照してください。
+ X-Amzn-Bedrock-OutputEncryptionKeyId (オプション) – 出力 S3 ファイルの暗号化に使用する KMS キーの ID。詳細については、[AWS KMS 「 (SSE-KMS) を使用したサーバー側の暗号化の指定](https://docs.aws.amazon.com/AmazonS3/latest/userguide/specifying-kms-encryption.html)」を参照してください。
+ X-Amzn-Bedrock-Tags (オプション) – 出力にアタッチするタグを示すキーと値のディクショナリ。詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。

**リクエスト本文パラメータ**
+ endpoint – `v1/chat/completions` である必要があります。
+ input\$1file\$1id – バッチ JSONL ファイルの S3 URI を指定します。

**生成された結果を検索する**  
作成レスポンスにはバッチ ID が含まれます。バッチ推論ジョブの結果とエラーログは、入力ファイルを含む S3 フォルダに書き込まれます。結果は、次のフォルダ構造と同様に、バッチ ID と同じ名前のフォルダにあります。

```
---- {batch_input_folder}
        |---- {batch_input}.jsonl
        |---- {batch_id}
	           |---- {batch_input}.jsonl.out
	           |---- {batch_input}.jsonl.err
```

さまざまな方法の OpenAI Create batch API の例を確認するには、任意の方法のタブを選択して手順に従います。

------
#### [ OpenAI SDK (Python) ]

OpenAI SDK を使用してバッチジョブを作成するには、次の手順を実行します。

1. OpenAI SDK をインポートし、次のフィールドを使用してクライアントを設定します。
   + `base_url` – 次の形式のように、Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1` に付けます。

     ```
     https://${bedrock-runtime-endpoint}/openai/v1
     ```
   + `api_key` – Amazon Bedrock API キーを指定します。
   + `default_headers` – ヘッダーを含める必要がある場合は、キーと値のペアとしてこのオブジェクトに含めることができます。または、特定の API コールを行うときに `extra_headers` でヘッダーを指定することもできます。

1. クライアントで [batches.create()](https://platform.openai.com/docs/api-reference/batch/create) 方法を使用します。

次の例を実行する前に、次のフィールドのプレースホルダーを置き換えます。
+ api\$1key – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ X-Amzn-BedrockRoleArn – *arn:aws:iam::123456789012:role/BatchServiceRole* を、設定した実際のバッチ推論サービスロールに置き換えます。
+ input\$1file\$1id – *s3://amzn-s3-demo-bucket/openai-input.jsonl* を、バッチ JSONL ファイルをアップロードした実際の S3 URI に置き換えます。

この例では、`us-west-2` で OpenAI Create batch job API を呼び出し、メタデータを 1 つ含めます。

```
from openai import OpenAI

client = OpenAI(
    base_url="https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1", 
    api_key="$AWS_BEARER_TOKEN_BEDROCK", # Replace with actual API key
    default_headers={
        "X-Amzn-Bedrock-RoleArn": "arn:aws:iam::123456789012:role/BatchServiceRole" # Replace with actual service role ARN
    }
)

job = client.batches.create(
    input_file_id="s3://amzn-s3-demo-bucket/openai-input.jsonl", # Replace with actual S3 URI
    endpoint="/v1/chat/completions",
    completion_window="24h",
    metadata={
        "description": "test input"
    },
    extra_headers={
        "X-Amzn-Bedrock-ModelId": "openai.gpt-oss-20b-1:0",
    }
)
print(job)
```

------
#### [ HTTP request ]

直接 HTTP リクエストを使用してチャット完了を作成するには、次の手順を実行します。

1. POST メソッドを使用し、次の形式で Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1/batches` に付け加えて URL を指定します。

   ```
   https://${bedrock-runtime-endpoint}/openai/v1/batches
   ```

1. `Authorization` ヘッダーで AWS 認証情報または Amazon Bedrock API キーを指定します。

次の例を実行する前に、まず次のフィールドのプレースホルダーを置き換えます。
+ 認証 – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ X-Amzn-BedrockRoleArn – *arn:aws:iam::123456789012:role/BatchServiceRole* を、設定した実際のバッチ推論サービスロールに置き換えます。
+ input\$1file\$1id – *s3://amzn-s3-demo-bucket/openai-input.jsonl* を、バッチ JSONL ファイルをアップロードした実際の S3 URI に置き換えます。

次の例では、`us-west-2` で Create chat completion API を呼び出し、メタデータを 1 つ含めます。

```
curl -X POST 'https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1/batches' \
    -H 'Authorization: Bearer $AWS_BEARER_TOKEN_BEDROCK' \  
    -H 'Content-Type: application/json' \
    -H 'X-Amzn-Bedrock-ModelId: openai.gpt-oss-20b-1:0' \
    -H 'X-Amzn-Bedrock-RoleArn: arn:aws:iam::123456789012:role/BatchServiceRole' \  
    -d '{    
    "input_file_id": "s3://amzn-s3-demo-bucket/openai-input.jsonl",    
    "endpoint": "/v1/chat/completions",    
    "completion_window": "24h",
    "metadata": {"description": "test input"}  
}'
```

------

## OpenAI バッチジョブを取得する
<a name="inference-openai-batch-retrieve"></a>

OpenAI Retrieve batch API リクエストとレスポンスの詳細については、「[Retrieve batch](https://platform.openai.com/docs/api-reference/batch/retrieve)」を参照してください。

リクエストを行うときは、情報を取得するバッチジョブの ID を指定します。レスポンスは、S3 バケットで検索できる出力ファイル名やエラーファイル名など、バッチジョブに関する情報を返します。

さまざまな方法の OpenAI Retrieve batch API を使用する例を確認するには、任意の方法のタブを選択して手順に従います。

------
#### [ OpenAI SDK (Python) ]

OpenAI SDK を使用してバッチジョブを取得するには、次の手順を実行します。

1. OpenAI SDK をインポートし、次のフィールドを使用してクライアントを設定します。
   + `base_url` – 次の形式のように、Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1` に付けます。

     ```
     https://${bedrock-runtime-endpoint}/openai/v1
     ```
   + `api_key` – Amazon Bedrock API キーを指定します。
   + `default_headers` – ヘッダーを含める必要がある場合は、キーと値のペアとしてこのオブジェクトに含めることができます。または、特定の API コールを行うときに `extra_headers` でヘッダーを指定することもできます。

1. クライアントで [batches.retrieve()](https://platform.openai.com/docs/api-reference/batch/create) 方法を使用し、情報を取得するバッチの ID を指定します。

次の例を実行する前に、次のフィールドのプレースホルダーを置き換えます。
+ api\$1key – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ batch\$1id – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。

この例では、ID が *batch\$1abc123* であるバッチジョブで、`us-west-2` の OpenAI Retrieve batch job API を呼び出します。

```
from openai import OpenAI

client = OpenAI(
    base_url="https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1", 
    api_key="$AWS_BEARER_TOKEN_BEDROCK" # Replace with actual API key
)

job = client.batches.retrieve(batch_id="batch_abc123") # Replace with actual ID

print(job)
```

------
#### [ HTTP request ]

直接 HTTP リクエストを使用してバッチジョブを取得するには、次の手順を実行します。

1. GET メソッドを使用し、次の形式で Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1/batches/${batch_id}` に設付け加えて URL を指定します。

   ```
   https://${bedrock-runtime-endpoint}/openai/v1/batches/batch_abc123
   ```

1. `Authorization` ヘッダーで AWS 認証情報または Amazon Bedrock API キーを指定します。

次の例を実行する前に、まず次のフィールドのプレースホルダーを置き換えます。
+ 認証 – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ batch\$1abc123 – パスで、この値をバッチジョブの実際の ID に置き換えます。

この例では、ID が *batch\$1abc123* であるバッチジョブで、`us-west-2` の OpenAI Retrieve batch API を呼び出します。

```
curl -X GET 'https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1/batches/batch_abc123' \
    -H 'Authorization: Bearer $AWS_BEARER_TOKEN_BEDROCK'
```

------

## OpenAI バッチジョブの一覧表示
<a name="inference-openai-batch-list"></a>

OpenAI List batches API リクエストとレスポンスの詳細については、「[List batches](https://platform.openai.com/docs/api-reference/batch/list)」を参照してください。レスポンスは、バッチジョブに関する情報の配列を返します。

リクエストを行うときに、クエリパラメータを含めて結果をフィルタリングできます。レスポンスは、S3 バケットで検索できる出力ファイル名やエラーファイル名など、バッチジョブに関する情報を返します。

さまざまな方法で OpenAI List batches API の例を確認するには、任意の方法のタブを選択して手順に従います。

------
#### [ OpenAI SDK (Python) ]

OpenAI SDK を使用してバッチジョブを一覧表示するには、次の手順を実行します。

1. OpenAI SDK をインポートし、次のフィールドを使用してクライアントを設定します。
   + `base_url` – 次の形式のように、Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1` に付けます。

     ```
     https://${bedrock-runtime-endpoint}/openai/v1
     ```
   + `api_key` – Amazon Bedrock API キーを指定します。
   + `default_headers` – ヘッダーを含める必要がある場合は、キーと値のペアとしてこのオブジェクトに含めることができます。または、特定の API コールを行うときに `extra_headers` でヘッダーを指定することもできます。

1. クライアントで [batches.list()](https://platform.openai.com/docs/api-reference/batch/list) 方法を使用します。オプションのパラメータを任意に含めることができます。

次の例を実行する前に、次のフィールドのプレースホルダーを置き換えます。
+ api\$1key – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。

この例では、`us-west-2` で OpenAI List batch jobs API を呼び出し、返す結果の上限を 2 つ指定します。

```
from openai import OpenAI

client = OpenAI(
    base_url="https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1", 
    api_key="$AWS_BEARER_TOKEN_BEDROCK" # Replace with actual API key
)

job = client.batches.list(limit=2)

print(job)
```

------
#### [ HTTP request ]

直接 HTTP リクエストを使用してバッチジョブを一覧表示するには、次の手順を実行します。

1. GET 方法を使用し、次の形式で Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1/batches` に設付け加えて URL を指定します。

   ```
   https://${bedrock-runtime-endpoint}/openai/v1/batches
   ```

   オプションのクエリパラメータを任意に含めることができます。

1. `Authorization` ヘッダーで AWS 認証情報または Amazon Bedrock API キーを指定します。

次の例を実行する前に、まず次のフィールドのプレースホルダーを置き換えます。
+ 認証 – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。

次の例では、`us-west-2` で OpenAI List batches API を呼び出し、返す結果の上限を 2 つ指定します。

```
curl -X GET 'https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1/batches?limit=2' \
    -H 'Authorization: Bearer $AWS_BEARER_TOKEN_BEDROCK' \
```

------

## OpenAI バッチジョブをキャンセルする
<a name="inference-openai-batch-cancel"></a>

OpenAI Cancel batch API のリクエストとレスポンスの詳細については、「[Cancel batch](https://platform.openai.com/docs/api-reference/batch/cancel)」を参照してください。レスポンスは、キャンセルされたバッチジョブに関する情報を返します。

リクエストを行うときは、キャンセルするバッチジョブの ID を指定します。

さまざまな方法で OpenAI Cancel batch API を使用する例を確認するには、任意の方法のタブを選択して手順に従います。

------
#### [ OpenAI SDK (Python) ]

OpenAI SDK を使用してバッチジョブをキャンセルするには、次の手順を実行します。

1. OpenAI SDK をインポートし、次のフィールドを使用してクライアントを設定します。
   + `base_url` – 次の形式のように、Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1` に付けます。

     ```
     https://${bedrock-runtime-endpoint}/openai/v1
     ```
   + `api_key` – Amazon Bedrock API キーを指定します。
   + `default_headers` – ヘッダーを含める必要がある場合は、キーと値のペアとしてこのオブジェクトに含めることができます。または、特定の API コールを行うときに `extra_headers` でヘッダーを指定することもできます。

1. クライアントで [batches.cancel()](https://platform.openai.com/docs/api-reference/batch/cancel) 方法を使用し、情報を取得するバッチの ID を指定します。

次の例を実行する前に、次のフィールドのプレースホルダーを置き換えます。
+ api\$1key – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ batch\$1id – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。

この例では、ID が *batch\$1abc123* であるバッチジョブで、`us-west-2` の OpenAI Cancel batch job API を呼び出します。

```
from openai import OpenAI

client = OpenAI(
    base_url="https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1", 
    api_key="$AWS_BEARER_TOKEN_BEDROCK" # Replace with actual API key
)

job = client.batches.cancel(batch_id="batch_abc123") # Replace with actual ID

print(job)
```

------
#### [ HTTP request ]

直接 HTTP リクエストを使用してバッチジョブをキャンセルするには、次の手順を実行します。

1. POST メソッドを使用し、次の形式で Amazon Bedrock ランタイムエンドポイントのプレフィックスを `/openai/v1/batches/${batch_id}/cancel` に付け加えて URL を指定します。

   ```
   https://${bedrock-runtime-endpoint}/openai/v1/batches/batch_abc123/cancel
   ```

1. `Authorization` ヘッダーで AWS 認証情報または Amazon Bedrock API キーを指定します。

次の例を実行する前に、まず次のフィールドのプレースホルダーを置き換えます。
+ 認証 – *\$1AWS\$1BEARER\$1TOKEN\$1BEDROCK* を実際の API キーに置き換えます。
+ batch\$1abc123 – パスで、この値をバッチジョブの実際の ID に置き換えます。

この例では、ID が *batch\$1abc123* であるバッチジョブで、`us-west-2` の OpenAI Cancel batch API を呼び出します。

```
curl -X GET 'https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1/batches/batch_abc123/cancel' \
    -H 'Authorization: Bearer $AWS_BEARER_TOKEN_BEDROCK'
```

------

# クロスリージョン推論によりスループットを向上させる
<a name="cross-region-inference"></a>

クロスリージョン推論では、特定の地域 (米国や欧州など) に関連付けられたクロスリージョン推論プロファイルを選択するか、グローバル推論プロファイルを選択できます。特定の地域に関連付けられた推論プロファイルを選択すると、Amazon Bedrock は推論リクエストを処理するために、その地域 AWS リージョン 内の最適なコマーシャルを自動的に選択します。グローバル推論プロファイルを使用すると、Amazon Bedrock はリクエストを処理するために最適な商用 AWS リージョン を自動的に選択し、利用可能なリソースを最適化してモデルのスループットを向上させます。

どちらのタイプのクロスリージョン推論も、基盤モデル (FM) とリクエストを AWS リージョン ルーティングできる を定義する[推論プロファイル](inference-profiles.md)を使用します。オンデマンドモードでモデル推論を実行する際、リクエストはサービスクォータまたはピーク使用時間によって制限される場合があります。クロスリージョン推論を使用すると、さまざまな でコンピューティングを利用することで、予期しないトラフィックバーストをシームレスに管理できます AWS リージョン。

[プロビジョンドスループット](prov-throughput.md)を購入することで、モデルのスループットを向上させることもできます。推論プロファイルは現在、プロビジョンドスループットをサポートしていません。

推論プロファイルを使用してクロスリージョン推論を実行できるリージョンとモデルを確認するには、「[推論プロファイルでサポートされているリージョンおよびモデル](inference-profiles-support.md)」を参照してください。

**Topics**
+ [地理的クロスリージョン推論とグローバルクロスリージョン推論の選択](#cross-region-inference-comparison)
+ [一般的な考慮事項](#cross-region-inference-general-considerations)
+ [地理的クロスリージョン推論](geographic-cross-region-inference.md)
+ [グローバルクロスリージョン推論](global-cross-region-inference.md)

## 地理的クロスリージョン推論とグローバルクロスリージョン推論の選択
<a name="cross-region-inference-comparison"></a>

Amazon Bedrock には 2 種類のクロスリージョン推論プロファイルがあり、それぞれが異なるユースケースとコンプライアンス要件に合わせて設計されています。


| 機能 | 地理的クロスリージョン推論 | グローバルクロスリージョン推論 | 推奨事項 | 
| --- | --- | --- | --- | 
| データレジデンシー | 地理的境界内 (米国、欧州、APAC など) | サポートされている世界中の AWS 商用リージョン | コンプライアンス要件に地理的 を選択する | 
| スループット | 単一リージョンよりも高い | 利用可能な最大値 | パフォーマンスを最大化するには Global を選択します。 | 
| Cost | 標準料金 | 約 10% の節約 | コスト最適化のためにグローバルを選択する | 
| SCP の要件 | プロファイル内のすべての送信先リージョンを許可する | 許可 "aws:RequestedRegion": "unspecified" | 組織のポリシーに基づいて を設定する | 
| 以下に最適: | データレジデンシー規制のある組織 | コストとパフォーマンスを優先する組織 | コンプライアンスとパフォーマンスのニーズを評価する | 

データレジデンシー要件があり、データ処理が特定の地理的境界内に留まるようにする必要がある場合は、地理的クロスリージョン推論を選択します。地理的制限なしでスループットとコスト削減を最大化する場合は、グローバルクロスリージョン推論を選択します。

## 一般的な考慮事項
<a name="cross-region-inference-general-considerations"></a>

クロスリージョン推論に関する以下の情報に注意してください。
+ クロスリージョン推論を使用する場合、追加のルーティングコストは必要ありません。料金は、推論プロファイルを呼び出すリージョンに基づいて計算されます。料金に関する詳細については、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」を参照してください。
+ クロスリージョン推論は、 で手動で有効になっていないリクエスト AWS リージョン を にルーティングできます AWS アカウント。クロスリージョン推論を機能させるには、リージョンを手動で有効にする必要はありません。
+ クロスリージョンオペレーション中に送信されるすべてのデータはネットワーク上に AWS 残り、パブリックインターネットを経由しません。データは転送中に暗号化されます AWS リージョン。
+ クロスリージョン推論リクエストはすべて、ソースリージョンの CloudTrail に記録されます。`additionalEventData.inferenceRegion` フィールドを探して、リクエストが処理された場所を特定します。
+ AWS Amazon Bedrock が提供するサービスも CRIS を使用する場合があります。詳細については、サービス固有のドキュメントを参照してください。

# 地理的クロスリージョン推論
<a name="geographic-cross-region-inference"></a>

地理的クロスリージョン推論は、データ処理を指定された地理的境界 (米国、欧州、APAC など) 内に維持し、単一リージョン推論よりも高いスループットを提供します。このオプションは、データレジデンシー要件とコンプライアンス規制がある組織に最適です。

## 地理的クロスリージョン推論に関する考慮事項
<a name="geographic-cris-considerations"></a>

地理的クロスリージョン推論に関する次の情報に注意してください。
+ 地域 (米国、欧州、APAC など) に関連付けられた推論プロファイルへのクロスリージョン推論リクエストは、データが最初に存在する地域の一部 AWS リージョン である 内に保持されます。たとえば、米国内で行われたリクエストは、米国内 AWS リージョン の 内に保持されます。データはソースリージョンにのみ保存されますが、クロスリージョン推論を使用する場合、入力プロンプトと出力結果がソースリージョン外に移動することがあります。すべてのデータは Amazon の安全なネットワーク経由で暗号化されて送信されます。
+ 地域 (米国、欧州、APAC など) に関連付けられた推論プロファイルを使用する場合のクロスリージョンスループットのデフォルトのクォータを確認するには、「*AWS 全般のリファレンス*」の「[Amazon Bedrock サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)」で「**\$1\$1Model\$1 のクロスリージョンモデル推論リクエスト/分**」と「**\$1\$1Model\$1 のクロスリージョンモデル推論トークン/分**」の値を参照してください。

## 地理的クロスリージョン推論の IAM ポリシー要件
<a name="geographic-cris-iam-setup"></a>

IAM ユーザーまたはロールが地理的クロスリージョン推論プロファイルを呼び出せるようにするには、次のリソースへのアクセスを許可する必要があります。

1. 地域固有のクロスリージョン推論プロファイル (これらのプロファイルには、`us`、`eu`、 などの地理的プレフィックスがあります`apac`)

1. ソースリージョンの基盤モデル

1. 地理的プロファイルにリストされているすべての送信先リージョンの基盤モデル

次のポリシー例では、Claude Sonnet 4.5 基盤モデルを米国の地理的クロスリージョン推論プロファイルで使用するために必要なアクセス許可を付与します。ここで、送信元リージョンは `us-east-1`で、送信先リージョンは `us-east-1`、`us-east-2`、および です`us-west-2`。

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}
```

最初のステートメントは、リクエスト元のリージョンから送信されるリクエストの地理的クロスリージョン推論プロファイルへの `bedrock:InvokeModel` API アクセスを許可します。2 番目のステートメントは、リクエスト元のリージョンと推論プロファイルにリストされているすべての送信先リージョンの両方で、基盤モデルへの `bedrock:InvokeModel` API アクセスを許可します。

## 地理的クロスリージョン推論のサービスコントロールポリシーの要件
<a name="geographic-cris-scp-setup"></a>

多くの組織は、セキュリティとコンプライアンスのために AWS Organizations のサービスコントロールポリシーを通じてリージョンのアクセスコントロールを実装しています。組織のセキュリティポリシーで SCPs を使用して未使用のリージョンをブロックする場合は、リージョン固有の SCP 条件が、ソースリージョンの地理的クロスリージョン推論プロファイルにリストされているすべての宛先リージョンへのアクセスを許可していることを確認する必要があります。

地理的クロスリージョン推論では、ソースリージョン (API コールを行う場所) と宛先リージョン (リクエストをルーティングできる場所) の関係を理解する必要があります。推論プロファイルのドキュメントを確認して、ソースリージョンのすべての送信先リージョンを特定し、SCPs がそれらのすべての送信先リージョンへのアクセスを許可していることを確認します。

たとえば、US Anthropic Claude Sonnet 4.5 Geographic プロファイルを使用して us-east-1 (ソースリージョン) から を呼び出す場合、リクエストは us-east-1、us-east-2、および us-west-2 (宛先リージョン) にルーティングできます。SCP が us-east-1 のみへのアクセスを制限する場合、us-east-2 または us-west-2 にルーティングしようとすると、クロスリージョン推論は失敗します。したがって、呼び出し元のリージョンに関係なく、SCP の 3 つの送信先リージョンすべてを許可する必要があります。

リージョンの除外用に SCPs を設定するときは、推論プロファイルの送信先リージョンをブロックすると、送信元リージョンが引き続きアクセス可能であっても、クロスリージョン推論が正しく機能しなくなることに注意してください。グローバルクロスリージョン推論の SCP 要件については、「」を参照してください[グローバルクロスリージョン推論のサービスコントロールポリシーの要件](global-cross-region-inference.md#global-cris-scp-setup)。

セキュリティを向上させるには、 `bedrock:InferenceProfileArn`条件を使用して特定の推論プロファイルへのアクセスを制限することを検討してください。これにより、使用できる推論プロファイルを制限しながら、必要なリージョンへのアクセスを許可できます。

## 地理的クロスリージョン推論を使用する
<a name="geographic-cris-usage"></a>

地理的クロスリージョン推論を使用するには、次の方法でモデル推論を実行するときに推論[プロファイル](inference-profiles.md)を含めます。
+ **オンデマンドモデル推論** – [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)、[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)、[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)、または [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) リクエストを送信するときに、推論プロファイルの ID を `modelId` と指定します。推論プロファイルは、ソースリージョンから発信される推論リクエストをルーティングできる 1 つ以上のリージョンを定義します。クロスリージョン推論を使用すると、推論プロファイルで定義されたリージョン間でモデル呼び出しリクエストを動的にルーティングすることで、スループットとパフォーマンスが向上します。ルーティング時には、ユーザートラフィック、需要、リソースの使用率が考慮されます。詳細については、[プロンプトを送信し、モデル推論を使用してレスポンスを生成する](inference.md)を参照してください。
+ **バッチ推論** – [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) リクエストを送信するときに推論プロファイルの ID を `modelId` と指定して、バッチ推論を使用してリクエストを非同期で送信します。推論プロファイルを使用すると、複数の AWS リージョン でコンピューティングを活用し、バッチジョブの処理時間を短縮できます。ジョブが完了したら、ソースリージョンの Amazon S3 バケットから出力ファイルを取得できます。
+ **エージェント** – [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html) リクエストの `foundationModel` フィールドで推論プロファイルの ID を指定します。詳細については、「[エージェントを手動で作成および設定する](agents-create.md)」を参照してください。
+ **ナレッジベースのレスポンス生成** – ナレッジベースのクエリ後にレスポンスを生成する場合に、クロスリージョン推論を使用できます。詳細については、「[クエリとレスポンスを使用してナレッジベースをテストする](knowledge-base-test.md)」を参照してください。
+ **モデル評価** – モデル評価ジョブを送信する際、評価するモデルとして推論プロファイルを送信できます。詳細については、「[Amazon Bedrock リソースのパフォーマンスを評価する](evaluation.md)」を参照してください。
+ **プロンプト管理** – プロンプト管理で作成したプロンプトのレスポンスを生成する際に、クロスリージョン推論を使用できます。詳細については、[Amazon Bedrock でプロンプト管理を使用して再利用可能なプロンプトを構築して保存する](prompt-management.md)を参照してください。
+ **プロンプトフロー** – プロンプトフローのプロンプトノードでインラインで定義したプロンプトのレスポンスを生成する際に、クロスリージョン推論を使用できます。詳細については、「[Amazon Bedrock フローを使用してエンドツーエンドの生成 AI ワークフローを構築する](flows.md)」を参照してください。

推論プロファイルを使用してリージョン間でモデル呼び出しリクエストを送信する方法については、「[モデル呼び出しで推論プロファイルを使用する](inference-profiles-use.md)」を参照してください。

クロスリージョン推論の詳細については、「[Amazon Bedrock でのクロスリージョン推論の開始方法](https://aws.amazon.com/blogs/machine-learning/getting-started-with-cross-region-inference-in-amazon-bedrock/)」を参照してください。

IAM セットアップやサービスクォータ管理など、グローバルなクロスリージョン推論の詳細については、「」を参照してください[グローバルクロスリージョン推論](global-cross-region-inference.md)。

# グローバルクロスリージョン推論
<a name="global-cross-region-inference"></a>

グローバルクロスリージョン推論は、クロスリージョン推論を地理的境界を超えて拡張し、サポートされている AWS リージョン 世界中の商用 への推論リクエストのルーティングを可能にし、利用可能なリソースを最適化し、モデルスループットを向上させます。

## グローバルクロスリージョン推論の利点
<a name="global-cris-benefits"></a>

Anthropic の Claude Sonnet 4.5 のグローバルクロスリージョン推論は、従来の地理的クロスリージョン推論プロファイルよりも複数の利点を提供します。
+ **ピーク需要時のスループットの向上** – グローバルクロスリージョン推論は、利用可能な容量 AWS リージョン を持つ にリクエストを自動的にルーティングすることで、ピーク需要の期間中の耐障害性を向上させます。この動的ルーティングは、開発者による追加の設定や介入なしにシームレスに行われます。間で複雑なクライアント側の負荷分散を必要とする従来のアプローチとは異なり AWS リージョン、グローバルクロスリージョン推論はトラフィックの急増を自動的に処理します。これは、ダウンタイムやパフォーマンスの低下が財務や評判に大きな影響を与える可能性があるビジネスクリティカルなアプリケーションにとって特に重要です。
+ **コスト効率 –** Anthropic の Claude Sonnet 4.5 のグローバルクロスリージョン推論では、地理的クロスリージョン推論と比較して、入力トークンと出力トークンの両方の料金が約 10% 削減されます。料金は、リクエスト AWS リージョン 元の (ソース) に基づいて計算されます AWS リージョン。つまり、組織はより低コストで回復力を向上させることができます。この料金モデルにより、グローバルクロスリージョン推論は、生成 AI デプロイの最適化を検討している組織にとって費用対効果の高いソリューションになります。リソース使用率を向上させ、追加コストなしでより高いスループットを実現することで、組織は Amazon Bedrock への投資の価値を最大化できます。
+ モニタリング**の合理化** – グローバルクロスリージョン推論を使用する場合、CloudWatch と CloudTrail は引き続きソースにログエントリを記録し AWS リージョン、オブザーバビリティと管理を簡素化します。リクエストは AWS リージョン 世界各地で処理されますが、使い慣れた AWS モニタリングツールを通じて、アプリケーションのパフォーマンスと使用パターンを一元的に把握できます。
+ **オンデマンドクォータの柔軟性** – グローバルクロスリージョン推論では、ワークロードが個々のリージョン容量に制限されなくなりました。特定の で使用可能な容量に制限される代わりに AWS リージョン、リクエストを AWS グローバルインフラストラクチャ全体に動的にルーティングできます。これにより、はるかに大きなリソースプールにアクセスできるため、大量のワークロードや突然のトラフィックスパイクを処理する複雑さが軽減されます。

## グローバルクロスリージョン推論に関する考慮事項
<a name="global-cris-considerations"></a>

グローバルクロスリージョン推論に関する次の情報に注意してください。
+ グローバルクロスリージョン推論プロファイルは、特定の地域に関連付けられた推論プロファイルよりも高いスループットを提供します。特定の地域に関連付けられた推論プロファイルは、単一リージョンの推論よりも高いスループットを提供します。
+ グローバル推論プロファイルを使用する場合のクロスリージョンスループットのデフォルトのクォータを確認するには、「*AWS 全般のリファレンス*」の「[Amazon Bedrock サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)」で「**\$1\$1Model\$1 のグローバルクロスリージョンモデル推論リクエスト/分**」と**「\$1\$1Model\$1 のグローバルクロスリージョンモデル推論トークン/分**」の値を参照してください。

  [Service Quotas コンソール](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas)から、または**ソース**リージョンで AWS CLI コマンドを使用して、グローバルクロスリージョン推論プロファイルのクォータをリクエスト、表示、管理できます。

## グローバルクロスリージョン推論の IAM ポリシー要件
<a name="global-cris-iam-setup"></a>

ユーザーに対してグローバルクロスリージョン推論を有効にするには、ロールに 3 つの IAM ポリシーを適用する必要があります。以下は、きめ細かな制御を提供する IAM ポリシーの例です。サンプルポリシー`<REQUESTING REGION>`の を、運用 AWS リージョン している に置き換えることができます。

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGlobalCrisInferenceProfileRegionAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileInRegionModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileGlobalModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "unspecified",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        }
    ]
}
```

ポリシーの最初の部分では、 リクエストのリージョン推論プロファイルへのアクセスを許可します AWS リージョン。2 番目のパートでは、リージョン FM リソースへのアクセスを提供します。3 番目のパートでは、クロスリージョンルーティング機能を有効にするグローバル FM リソースへのアクセスを許可します。

これらのポリシーを実装するときは、3 つのリソース Amazon リソースネーム (ARNs) がすべて IAM ステートメントに含まれていることを確認してください。
+ リージョン推論プロファイル ARN はパターン に従います`arn:aws:bedrock:REGION:ACCOUNT:inference-profile/global.MODEL-NAME`。これは、ソース のグローバル推論プロファイルへのアクセスを許可するために使用されます AWS リージョン。
+ リージョン FM は を使用します`arn:aws:bedrock:REGION::foundation-model/MODEL-NAME`。これは、ソースの FM へのアクセスを許可するために使用されます AWS リージョン。
+ グローバル FM には が必要です`arn:aws:bedrock:::foundation-model/MODEL-NAME`。これは、さまざまなグローバルの FM へのアクセスを許可するために使用されます AWS リージョン。

グローバル FM ARN には、 AWS リージョン または アカウントが指定されていません。これは意図的で、クロスリージョン機能に必要です。

### グローバルクロスリージョン推論を無効にする
<a name="global-cris-iam-disable"></a>

2 つの主要なアプローチから選択して、特定の IAM ロールのグローバル CRIS に拒否ポリシーを実装できます。それぞれのユースケースと影響は異なります。
+ **IAM ポリシーの削除** – 最初の方法では、ユーザーアクセス許可から 3 つの必要な IAM ポリシーのうち 1 つ以上を削除します。グローバル CRIS では 3 つのポリシーすべてが機能する必要があるため、ポリシーを削除するとアクセスが拒否されます。
+ **拒否ポリシーの実装** – 2 番目のアプローチは、グローバル CRIS 推論プロファイルを特にターゲットとする明示的な拒否ポリシーを実装することです。この方法では、セキュリティインテントを明確に文書化し、後で誰かが必要な許可ポリシーを誤って追加した場合でも、明示的な拒否が優先されます。拒否ポリシーは、パターン に一致する`StringEquals`条件を使用する必要があります`"aws:RequestedRegion": "unspecified"`。このパターンは、特に `global` プレフィックスを持つ推論プロファイルを対象としています。

拒否ポリシーを実装するときは、グローバル CRIS が`aws:RequestedRegion`フィールドの動作を変更することを理解することが重要です。などの特定の AWS リージョン 名前`StringEquals`の条件を使用する従来の AWS リージョンベースの拒否ポリシー`"aws:RequestedRegion": "us-west-2"`は、グローバル CRIS では期待どおりに機能しません。これは、サービスが実際の送信先`global`ではなくこのフィールドを に設定するためです AWS リージョン。ただし、前述のように、 `"aws:RequestedRegion": "unspecified"` は拒否効果をもたらします。

## グローバルクロスリージョン推論のサービスコントロールポリシーの要件
<a name="global-cris-scp-setup"></a>

グローバルクロスリージョン推論の場合、組織のセキュリティポリシーで SCPs を使用して未使用のリージョンをブロックする場合は、リージョン固有の SCP 条件を更新して、 によるアクセスを許可する必要があります`"aws:RequestedRegion": "unspecified"`。この条件は Amazon Bedrock Global クロスリージョン推論に固有であり、サポートされているすべての AWS 商用リージョンにリクエストをルーティングできます。

次の SCP の例では、 をグローバルルーティングのリージョン`"unspecified"`として使用する Amazon Bedrock Global Cross-Region Inference コールを許可しながら、承認されたリージョン外のすべての AWS API コールをブロックします。

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "DenyAllOutsideApprovedRegions",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "*",
            "Condition": {
                "StringNotEquals": {
                    "aws:RequestedRegion": [
                        "us-east-1",
                        "us-east-2",
                        "us-west-2",
                        "unspecified"
                    ]
                }
            }
        }
    ]
}
```

### グローバルクロスリージョン推論を無効にする
<a name="global-cris-disable"></a>

データレジデンシーまたはコンプライアンス要件を持つ組織は、リクエストがサポートされている他の AWS 商用リージョンで処理される可能性があるため、グローバルクロスリージョン推論がコンプライアンスフレームワークに適合するかどうかを評価する必要があります。グローバルクロスリージョン推論を明示的に無効にするには、次の SCP ポリシーを実装します。

```
{
    "Effect": "Deny",
    "Action": "bedrock:*",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        },
        "ArnLike": {
            "bedrock:InferenceProfileArn": "arn:aws:bedrock:*:*:inference-profile/global.*"
        }
    }
}
```

この SCP はグローバルクロスリージョン推論を明示的に拒否します。これは、 `"aws:RequestedRegion"`が `"unspecified"`であり、`"ArnLike"`条件が ARN の `global` プレフィックスを持つ推論プロファイルをターゲットにしているためです。

### AWS Control Tower の実装
<a name="control-tower-scp"></a>

 AWS Control Tower が管理する SCPs を手動で編集することは、ドリフトを引き起こす可能性があるため、強くお勧めしません。代わりに、Control Tower が提供するメカニズムを使用してこれらの例外を管理します。コア原則には、既存のリージョン拒否コントロールを拡張するか、リージョンを有効にしてから、カスタムの条件付きブロッキングポリシーを適用することが含まれます。

Control Tower を使用したクロスリージョン推論の実装に関する詳細なstep-by-stepについては、ブログ記事[「マルチアカウント環境で Amazon Bedrock クロスリージョン推論を有効にする](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/)」を参照してください。これには、既存のリージョン拒否 SCPs を拡張し、カスタム SCPs で拒否されたリージョンを有効にし、Customizations for AWS Control Tower (CfCT) を使用してカスタム SCPs としてデプロイすることが含まれます。

## グローバルクロスリージョン推論のリクエスト制限の引き上げ
<a name="global-cris-quotas"></a>

グローバル CRIS 推論プロファイルを使用する場合、20 を超えるサポートされているソースからグローバル CRIS を使用できます AWS リージョン。これはグローバル制限であるため、グローバルクロスリージョン推論プロファイルの表示、管理、またはクォータの引き上げのリクエストは、リクエストされたソースの Service Quotas コンソールまたはコマンドラインインターフェイス (AWS CLI) AWS を使用して行う必要があります AWS リージョン。

制限の引き上げをリクエストするには、次の手順を実行します。

1.  AWS アカウントの Service Quotas コンソールにサインインします。

1. ナビゲーションペインで、**AWS [サービス]** を選択します。

1. サービスのリストから、**Amazon Bedrock** を見つけて選択します。

1. Amazon Bedrock のクォータのリストで、検索フィルターを使用して特定のグローバル CRIS クォータを見つけます。例えば、次のようになります。
   + Anthropic Claude Sonnet 4.5 V1 のグローバルクロスリージョンモデル推論トークン/分

1. 引き上げたいクォータを選択します。

1. **[アカウントレベルでの引き上げをリクエスト]** をクリックします。

1. 目的の新しいクォータ値を入力します。

1. **[Request]** (リクエスト) を選択して、リクエストを送信します。

必要なクォータの引き上げを計算するときは、バーンダウン率を考慮してください。バーンダウン率は、入力トークンと出力トークンがスロットリングシステムのトークンクォータ使用量に変換されるレートとして定義されます。次のモデルでは、**出力トークンのバーンダウン率が 5 倍です (1 つの出力トークンがクォータから 5 つのトークンを消費します)**。
+ Anthropic Claude Opus 4
+ Anthropic Claude Sonnet 4.5
+ Anthropic Claude Sonnet 4
+ Anthropic Claude 3.7 Sonnet

他のすべてのモデルの場合、バーンダウンレートは **1:1** になります (1 つの出力トークンはクォータから 1 つのトークンを消費します)。入力トークンの場合、トークンとクォータの比率は 1:1 です。リクエストあたりのトークンの合計数の計算は次のとおりです。

`Input token count + Cache write input tokens + (Output token count x Burndown rate)`

## グローバルクロスリージョン推論を使用する
<a name="global-cris-usage"></a>

Anthropic の Claude Sonnet 4.5 でグローバルクロスリージョン推論を使用するには、デベロッパーが以下の重要なステップを完了する必要があります。
+ **グローバル推論プロファイル ID を使用する** – Amazon Bedrock を API コールするときは、 AWS リージョン特定のモデル ID ではなく、グローバル Anthropic の Claude Sonnet 4.5 推論プロファイル ID (`global.anthropic.claude-sonnet-4-5-20250929-v1:0`) を指定します。
+ **IAM アクセス許可の設定** – 潜在的な送信先で推論プロファイルと FMs にアクセスするための適切な IAM アクセス許可を付与します AWS リージョン。

グローバルクロスリージョン推論は、以下に対してサポートされています。
+ オンデマンドモデル推論
+ バッチ推論
+ [エージェント]   
+ モデル評価
+ プロンプト管理
+ プロンプトフロー

**注記**  
グローバル推論プロファイルは、オンデマンドモデル推論、バッチ推論、エージェント、モデル評価、プロンプト管理、プロンプトフローでサポートされています。

## グローバルクロスリージョン推論を実装する
<a name="global-cris-implementation"></a>

Anthropic の Claude Sonnet 4.5 を使用したグローバルクロスリージョン推論の実装は簡単で、既存のアプリケーションコードにわずかな変更を加えるだけで済みます。以下は、Python でコードを更新する方法の例です。

```
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
model_id = "global.anthropic.claude-sonnet-4-5-20250929-v1:0"  
response = bedrock.converse(
    messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}],
    modelId=model_id,
)

print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])
```

# 推論プロファイルを使用してモデル呼び出しリソースを設定する
<a name="inference-profiles"></a>

*推論プロファイル*とは、モデルと、その推論プロファイルによるモデル呼び出しリクエストのルーティング先となる 1 つ以上のリージョンを定義する Amazon Bedrock のリソースです。推論プロファイルは次のタスクで使用できます。
+ **使用状況メトリクスを追跡する** – CloudWatch ログを設定し、アプリケーション推論プロファイルを使用してモデル呼び出しリクエストを送信して、モデル呼び出しの使用状況メトリクスを収集します。推論プロファイルに関する情報を表示するときにこれらのメトリクスを確認し、メトリクスを使用して決定事項を通知することができます。CloudWatch ログの設定方法の詳細については、「[CloudWatch Logs と Amazon S3 を使用してモデル呼び出しをモニタリングする](model-invocation-logging.md)」を参照してください。
+ **タグを使用してコストをモニタリングする** – オンデマンドのモデル呼び出しリクエストを送信するときに、アプリケーション推論プロファイルにタグをアタッチしてコストを追跡します。コスト配分にタグを使用する方法の詳細については、「 AWS Billing ユーザーガイド」の[「コスト配分タグを使用した AWS コストの整理と追跡](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/cost-alloc-tags.html)」を参照してください。
+ **クロスリージョン推論** – 複数の AWS リージョンを含む推論プロファイルを使用してスループットを向上させます。推論プロファイルは、これらのリージョンにモデル呼び出しリクエストを分散して、スループットとパフォーマンスを向上させます。クロスリージョン推論の詳細については、「[クロスリージョン推論によりスループットを向上させる](cross-region-inference.md)」を参照してください。

Amazon Bedrock には、次のタイプの推論プロファイルが用意されています。
+ **クロスリージョン (システム定義) 推論プロファイル** – Amazon Bedrock で事前定義され、モデルへのリクエストのルーティング先となる複数のリージョンを含む推論プロファイル。
+ **アプリケーション推論プロファイル** – コストとモデルの使用状況を追跡するためにユーザーが作成する推論プロファイル。モデル呼び出しリクエストを 1 つのリージョンまたは複数のリージョンにルーティングする推論プロファイルを作成できます。
  + 1 つのリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、推論プロファイルによるリクエストのルーティング先となるリージョンで基盤モデルを指定します。
  + 複数のリージョンでモデルのコストと使用状況を追跡する推論プロファイルを作成するには、モデルと、推論プロファイルによるリクエストのルーティング先となるリージョンを定義するクロスリージョン (システム定義) 推論プロファイルを指定します。

推論プロファイルを以下の機能で使用すると、リクエストを複数のリージョンにルーティングしたり、これらの機能を使用して行われた呼び出しリクエストの使用状況とコストを追跡したりできます。
+ モデル推論 – Amazon Bedrock コンソールのプレイグラウンドで推論プロファイルを選択するか、[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)、[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)、[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)、[ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) オペレーションの呼び出し時に推論プロファイルの ARN を指定することで、モデル呼び出しを実行する際に推論プロファイルを使用します。詳細については、「[プロンプトを送信し、モデル推論を使用してレスポンスを生成する](inference.md)」を参照してください。
+ ナレッジベースのベクトル埋め込みとレスポンス生成 – ナレッジベースでのクエリ後にレスポンスを生成する場合や、データソース内の非テキスト情報を解析する場合に、推論プロファイルを使用します。詳細については、「[クエリとレスポンスを使用してナレッジベースをテストする](knowledge-base-test.md)」および「[データソースの解析オプション](kb-advanced-parsing.md)」を参照してください。
+ モデル評価 – モデル評価ジョブを送信する際、評価するモデルとして推論プロファイルを送信できます。詳細については、「[Amazon Bedrock リソースのパフォーマンスを評価する](evaluation.md)」を参照してください。
+ プロンプト管理 – プロンプト管理で作成したプロンプトのレスポンスを生成する際に、推論プロファイルを使用できます。詳細については、[Amazon Bedrock でプロンプト管理を使用して再利用可能なプロンプトを構築して保存する](prompt-management.md)を参照してください。
+ フロー – フローのプロンプトノードでインラインに定義したプロンプトのレスポンスを生成する際に、推論プロファイルを使用できます。詳細については、「[Amazon Bedrock フローを使用してエンドツーエンドの生成 AI ワークフローを構築する](flows.md)」を参照してください。

推論プロファイルを使用する料金は、推論プロファイルを呼び出すリージョンでのモデルの料金に基づいて計算されます。料金に関する詳細については、「[Amazon Bedrock の料金](https://aws.amazon.com/bedrock/pricing/)」を参照してください。

クロスリージョン推論プロファイルで提供できるスループットの詳細については、「[クロスリージョン推論によりスループットを向上させる](cross-region-inference.md)」を参照してください。

**Topics**
+ [推論プロファイルでサポートされているリージョンおよびモデル](inference-profiles-support.md)
+ [推論プロファイルの前提条件](inference-profiles-prereq.md)
+ [アプリケーション推論プロファイルを作成する](inference-profiles-create.md)
+ [アプリケーション推論プロファイルのタグを変更する](inference-profiles-modify.md)
+ [推論プロファイルに関する情報を表示する](inference-profiles-view.md)
+ [モデル呼び出しで推論プロファイルを使用する](inference-profiles-use.md)
+ [アプリケーション推論プロファイルを削除する](inference-profiles-delete.md)

# 推論プロファイルでサポートされているリージョンおよびモデル
<a name="inference-profiles-support"></a>

Amazon Bedrock でサポートされているリージョンコードとエンドポイントのリストについては、「[Amazon Bedrock endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bedrock_region)」を参照してください。このトピックでは、使用できる事前定義推論プロファイルと、アプリケーション推論プロファイルをサポートするリージョンおよびモデルについて説明します。

**Topics**
+ [サポートされているクロスリージョン推論プロファイル](#inference-profiles-support-system)
+ [アプリケーション推論プロファイルでサポートされているリージョンとモデル](#inference-profiles-support-user)

## サポートされているクロスリージョン推論プロファイル
<a name="inference-profiles-support-system"></a>

クロスリージョン (システム定義) 推論プロファイルを使用して、[クロスリージョン推論](cross-region-inference.md)を実行できます。クロスリージョン推論を使用すると、さまざまな でコンピューティングを利用することで、予期しないトラフィックバーストをシームレスに管理できます AWS リージョン。クロスリージョン推論を使用すると、複数の AWS リージョンにトラフィックを分散できます。

クロスリージョン (システム定義) 推論プロファイルは、サポートするモデルにちなんで命名され、サポートするリージョンによって定義されます。クロスリージョン推論プロファイルがリクエストを処理する方法を理解するには、次の定義を確認してください。
+ **ソースリージョン** – 推論プロファイルを指定する API リクエストを行うリージョン。
+ **送信先リージョン** – Amazon Bedrock サービスがソースリージョンからのリクエストをルーティングできるリージョン。

Amazon Bedrock でクロスリージョン推論プロファイルを呼び出すと、リクエストはソースリージョンから発信され、そのプロファイルで定義されている送信先リージョンの 1 つに自動的にルーティングされて、パフォーマンスが最適化されます。グローバルクロスリージョン推論プロファイルの送信先リージョンには、商用リージョンがすべて含まれます。

**注記**  
クロスリージョン推論プロファイルの送信先リージョンには、オ*プトインリージョンを含めることができます。オプトイン*リージョンは、 AWS アカウント または組織レベルで明示的に有効にする必要があるリージョンです。詳細については、アカウントの[「有効または無効にする AWS リージョン](https://docs.aws.amazon.com/accounts/latest/reference/manage-acct-regions.html)」を参照してください。クロスリージョン推論プロファイルを使用する場合、プロファイル内の任意の送信先リージョンをアカウントでオプトインしなかった場合でも、推論リクエストはその送信先リージョンにルーティングされる可能性があります。

サービスコントロールポリシー (SCPs) と AWS Identity and Access Management (IAM) ポリシーは連携して、クロスリージョン推論が許可される場所を制御します。SCP を使用すると、Amazon Bedrock で推論に使用できるリージョンを制御でき、IAM ポリシーを使用すると、推論を実行するためのアクセス許可を持つユーザーまたはロールを定義できます。クロスリージョン推論プロファイルの任意の送信先リージョンが SCP でブロックされている場合、他のリージョンが許可されていてもリクエストは失敗します。クロスリージョン推論による効率的なオペレーションを確保するために、選択した推論プロファイルに含まれるすべての送信先リージョンで、必要なすべての Amazon Bedrock 推論アクション (`bedrock:InvokeModel*` や `bedrock:CreateModelInvocationJob` など) を許可するように SCP と IAM ポリシーを更新できます。詳細については、「[Enabling Amazon Bedrock cross-Region inference in multi-account environments](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/)」を参照してください。

**注記**  
一部の推論プロファイルは、呼び出し元のソースリージョンに応じて異なる送信先リージョンにルーティングされます。例えば、米国東部 (オハイオ) から `us.anthropic.claude-3-haiku-20240307-v1:0` を呼び出すと、リクエストを `us-east-1`、`us-east-2`、または `us-west-2` にルーティングできますが、米国西部 (オレゴン) から呼び出すと、リクエストを `us-east-1` と `us-west-2` にのみルーティングできます。

推論プロファイルのソースリージョンと送信先リージョンを確認するには、次のいずれかを実行します。
+ [サポートされているクロスリージョン推論プロファイルのリスト](#inference-profiles-support)で対応するセクションを展開します。
+ ソースリージョンから [Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [GetInferenceProfile](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetInferenceProfile.html) リクエストを送信し、`inferenceProfileIdentifier` フィールドに推論プロファイルの Amazon リソースネーム (ARN) または ID を指定します。レスポンスの `models` フィールドは、各送信先リージョンを識別できるモデル ARN のリストにマッピングされます。

**注記**  
リクエストを処理できる商用リージョン AWS が追加されると、特定のモデルのグローバルクロスリージョン推論プロファイルは時間の経過とともに変化する可能性があります。ただし、推論プロファイルが地域 (米国、欧州、APAC など) に関連付けられている場合、その送信先リージョンリストは変更されません。 は、新しいリージョンを組み込む新しい推論プロファイルを作成する AWS 可能性があります。これらの推論プロファイルを使用するようにシステムを更新するには、セットアップ内の ID を新しいものに変更します。  
グローバルクロスリージョン推論プロファイルは現在、米国西部 (オレゴン)、米国東部 (バージニア北部)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京) の各ソースリージョンの Anthropic Claude Sonnet 4 モデルでのみサポートされています。グローバル推論プロファイルの送信先リージョンには、すべての商用 AWS リージョンが含まれます。

次のセクションのいずれかを展開して、クロスリージョン推論プロファイル、呼び出し可能な送信元リージョン、およびリクエストをルーティングできる送信先リージョンに関する情報を表示します。

### グローバル Amazon Nova 2 Lite
<a name="cross-region-ip-global.amazon.nova-2-lite-v1:0"></a>

GLOBAL Amazon Nova 2 Lite 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
global.amazon.nova-2-lite-v1:0
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### GLOBAL Anthropic Claude Opus 4.5
<a name="cross-region-ip-global.anthropic.claude-opus-4-5-20251101-v1:0"></a>

GLOBAL Anthropic Claude Opus 4.5 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-opus-4-5-20251101-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### グローバル TwelveLabs ペガサス v1.2
<a name="cross-region-ip-global.twelvelabs.pegasus-1-2-v1:0"></a>

GLOBAL TwelveLabs Pegasus v1.2 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
global.twelvelabs.pegasus-1-2-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-pegasus.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Anthropic Claude Haiku 4.5
<a name="cross-region-ip-global.anthropic.claude-haiku-4-5-20251001-v1:0"></a>

Global Anthropic Claude Haiku 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-haiku-4-5-20251001-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Anthropic Claude Opus 4.6
<a name="cross-region-ip-global.anthropic.claude-opus-4-6-v1"></a>

Global Anthropic Claude Opus 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-opus-4-6-v1
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Anthropic Claude Sonnet 4.6
<a name="cross-region-ip-global.anthropic.claude-sonnet-4-6"></a>

Global Anthropic Claude Sonnet 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-sonnet-4-6
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Claude Sonnet 4
<a name="cross-region-ip-global.anthropic.claude-sonnet-4-20250514-v1:0"></a>

Global Claude Sonnet 4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-sonnet-4-20250514-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Claude Sonnet 4.5
<a name="cross-region-ip-global.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

Global Claude Sonnet 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
global.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| af-south-1 |  Commercial AWS Regions af-south-1  | 
| ap-east-2 |  Commercial AWS Regions ap-east-2  | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ap-southeast-5 |  Commercial AWS Regions ap-southeast-5  | 
| ap-southeast-7 |  Commercial AWS Regions ap-southeast-7  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| ca-west-1 |  Commercial AWS Regions ca-west-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| il-central-1 |  Commercial AWS Regions il-central-1  | 
| me-central-1 |  Commercial AWS Regions me-central-1  | 
| me-south-1 |  Commercial AWS Regions me-south-1  | 
| mx-central-1 |  Commercial AWS Regions mx-central-1  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### Global Cohere Embed v4
<a name="cross-region-ip-global.cohere.embed-v4:0"></a>

Global Cohere Embed v4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
global.cohere.embed-v4:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-embed.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  Commercial AWS Regions ap-northeast-1  | 
| ap-northeast-2 |  Commercial AWS Regions ap-northeast-2  | 
| ap-northeast-3 |  Commercial AWS Regions ap-northeast-3  | 
| ap-south-1 |  Commercial AWS Regions ap-south-1  | 
| ap-south-2 |  Commercial AWS Regions ap-south-2  | 
| ap-southeast-1 |  Commercial AWS Regions ap-southeast-1  | 
| ap-southeast-2 |  Commercial AWS Regions ap-southeast-2  | 
| ap-southeast-3 |  Commercial AWS Regions ap-southeast-3  | 
| ap-southeast-4 |  Commercial AWS Regions ap-southeast-4  | 
| ca-central-1 |  Commercial AWS Regions ca-central-1  | 
| eu-central-1 |  Commercial AWS Regions eu-central-1  | 
| eu-central-2 |  Commercial AWS Regions eu-central-2  | 
| eu-north-1 |  Commercial AWS Regions eu-north-1  | 
| eu-south-1 |  Commercial AWS Regions eu-south-1  | 
| eu-south-2 |  Commercial AWS Regions eu-south-2  | 
| eu-west-1 |  Commercial AWS Regions eu-west-1  | 
| eu-west-2 |  Commercial AWS Regions eu-west-2  | 
| eu-west-3 |  Commercial AWS Regions eu-west-3  | 
| sa-east-1 |  Commercial AWS Regions sa-east-1  | 
| us-east-1 |  Commercial AWS Regions us-east-1  | 
| us-east-2 |  Commercial AWS Regions us-east-2  | 
| us-west-1 |  Commercial AWS Regions us-west-1  | 
| us-west-2 |  Commercial AWS Regions us-west-2  | 

### 米国 Amazon Nova 2 Lite
<a name="cross-region-ip-us.amazon.nova-2-lite-v1:0"></a>

US Amazon Nova 2 Lite 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.amazon.nova-2-lite-v1:0
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| ca-west-1 |  ca-west-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Anthropic Claude 3 Haiku
<a name="cross-region-ip-us.anthropic.claude-3-haiku-20240307-v1:0"></a>

US Anthropic Claude 3 Haiku 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-haiku-20240307-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Anthropic Claude 3 Opus
<a name="cross-region-ip-us.anthropic.claude-3-opus-20240229-v1:0"></a>

US Anthropic Claude 3 Opus 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-opus-20240229-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Anthropic Claude 3 Sonnet
<a name="cross-region-ip-us.anthropic.claude-3-sonnet-20240229-v1:0"></a>

US Anthropic Claude 3 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-sonnet-20240229-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Anthropic Claude 3.5 Haiku
<a name="cross-region-ip-us.anthropic.claude-3-5-haiku-20241022-v1:0"></a>

US Anthropic Claude 3.5 Haiku 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-5-haiku-20241022-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Anthropic Claude 3.5 Sonnet
<a name="cross-region-ip-us.anthropic.claude-3-5-sonnet-20240620-v1:0"></a>

US Anthropic Claude 3.5 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-5-sonnet-20240620-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Anthropic Claude 3.5 Sonnet v2
<a name="cross-region-ip-us.anthropic.claude-3-5-sonnet-20241022-v2:0"></a>

US Anthropic Claude 3.5 Sonnet v2 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-5-sonnet-20241022-v2:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Anthropic Claude 3.7 Sonnet
<a name="cross-region-ip-us.anthropic.claude-3-7-sonnet-20250219-v1:0"></a>

US Anthropic Claude 3.7 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-3-7-sonnet-20250219-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Anthropic Claude Haiku 4.5
<a name="cross-region-ip-us.anthropic.claude-haiku-4-5-20251001-v1:0"></a>

US Anthropic Claude Haiku 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-haiku-4-5-20251001-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国 Anthropic Claude Opus 4.5
<a name="cross-region-ip-us.anthropic.claude-opus-4-5-20251101-v1:0"></a>

US Anthropic Claude Opus 4.5 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-opus-4-5-20251101-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国 Anthropic Claude Opus 4.6
<a name="cross-region-ip-us.anthropic.claude-opus-4-6-v1"></a>

US Anthropic Claude Opus 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-opus-4-6-v1
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| ca-west-1 |  ca-west-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Anthropic Claude Sonnet 4.5
<a name="cross-region-ip-us.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

US Anthropic Claude Sonnet 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国 Anthropic Claude Sonnet 4.6
<a name="cross-region-ip-us.anthropic.claude-sonnet-4-6"></a>

US Anthropic Claude Sonnet 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-sonnet-4-6
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 us-east-1 us-east-2 us-west-2  | 
| ca-west-1 |  ca-west-1 us-east-1 us-east-2 us-west-2  | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Claude Opus 4
<a name="cross-region-ip-us.anthropic.claude-opus-4-20250514-v1:0"></a>

US Claude Opus 4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-opus-4-20250514-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Claude Opus 4.1
<a name="cross-region-ip-us.anthropic.claude-opus-4-1-20250805-v1:0"></a>

US Claude Opus 4.1 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-opus-4-1-20250805-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Claude Sonnet 4
<a name="cross-region-ip-us.anthropic.claude-sonnet-4-20250514-v1:0"></a>

US Claude Sonnet 4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.anthropic.claude-sonnet-4-20250514-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Cohere Embed v4
<a name="cross-region-ip-us.cohere.embed-v4:0"></a>

US Cohere Embed v4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.cohere.embed-v4:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-embed.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US DeepSeek-R1
<a name="cross-region-ip-us.deepseek.r1-v1:0"></a>

US DeepSeek-R1 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.deepseek.r1-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://www.deepseek.com/)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Llama 4 Maverick 17B Instruct
<a name="cross-region-ip-us.meta.llama4-maverick-17b-instruct-v1:0"></a>

US Llama 4 Maverick 17B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama4-maverick-17b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Llama 4 Scout 17B Instruct
<a name="cross-region-ip-us.meta.llama4-scout-17b-instruct-v1:0"></a>

US Llama 4 Scout 17B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama4-scout-17b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Meta Llama 3.1 70B Instruct
<a name="cross-region-ip-us.meta.llama3-1-70b-instruct-v1:0"></a>

US Meta Llama 3.1 70B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-1-70b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Meta Llama 3.1 8B Instruct
<a name="cross-region-ip-us.meta.llama3-1-8b-instruct-v1:0"></a>

US Meta Llama 3.1 8B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-1-8b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Meta Llama 3.1 Instruct 405B
<a name="cross-region-ip-us.meta.llama3-1-405b-instruct-v1:0"></a>

US Meta Llama 3.1 Instruct 405B 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-1-405b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 

### US Meta Llama 3.2 11B Instruct
<a name="cross-region-ip-us.meta.llama3-2-11b-instruct-v1:0"></a>

US Meta Llama 3.2 11B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-2-11b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Meta Llama 3.2 1B Instruct
<a name="cross-region-ip-us.meta.llama3-2-1b-instruct-v1:0"></a>

US Meta Llama 3.2 1B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-2-1b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Meta Llama 3.2 3B Instruct
<a name="cross-region-ip-us.meta.llama3-2-3b-instruct-v1:0"></a>

US Meta Llama 3.2 3B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-2-3b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Meta Llama 3.2 90B Instruct
<a name="cross-region-ip-us.meta.llama3-2-90b-instruct-v1:0"></a>

US Meta Llama 3.2 90B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-2-90b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-west-2  | 

### US Meta Llama 3.3 70B Instruct
<a name="cross-region-ip-us.meta.llama3-3-70b-instruct-v1:0"></a>

US Meta Llama 3.3 70B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.meta.llama3-3-70b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Mistral Pixtral Large 25.02
<a name="cross-region-ip-us.mistral.pixtral-large-2502-v1:0"></a>

US Mistral Pixtral Large 25.02 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.mistral.pixtral-large-2502-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-mistral.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Nova Lite
<a name="cross-region-ip-us.amazon.nova-lite-v1:0"></a>

US Nova Lite 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.amazon.nova-lite-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Nova Micro
<a name="cross-region-ip-us.amazon.nova-micro-v1:0"></a>

US Nova Micro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.amazon.nova-micro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Nova Premier
<a name="cross-region-ip-us.amazon.nova-premier-v1:0"></a>

US Nova Premier 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.amazon.nova-premier-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Nova Pro
<a name="cross-region-ip-us.amazon.nova-pro-v1:0"></a>

US Nova Pro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.amazon.nova-pro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国ペガサス v1.2
<a name="cross-region-ip-us.twelvelabs.pegasus-1-2-v1:0"></a>

US Pegasus v1.2 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.twelvelabs.pegasus-1-2-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-pegasus.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国の安定したイメージの保守的なスケールアップ
<a name="cross-region-ip-us.stability.stable-conservative-upscale-v1:0"></a>

US Stable Image Conservative Upscale 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.stability.stable-conservative-upscale-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](stable-image-services.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Control Sketch
<a name="cross-region-ip-us.stability.stable-image-control-sketch-v1:0"></a>

US Stable Image Control Sketch 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-control-sketch-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Control Structure
<a name="cross-region-ip-us.stability.stable-image-control-structure-v1:0"></a>

US Stable Image Control Structure 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-control-structure-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国安定イメージクリエイティブアップスケール
<a name="cross-region-ip-us.stability.stable-creative-upscale-v1:0"></a>

US Stable Image Creative Upscale 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.stability.stable-creative-upscale-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](stable-image-services.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Erase Object
<a name="cross-region-ip-us.stability.stable-image-erase-object-v1:0"></a>

US Stable Image Erase Object 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-erase-object-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国の安定したイメージの高速アップスケール
<a name="cross-region-ip-us.stability.stable-fast-upscale-v1:0"></a>

US Stable Image Fast Upscale 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.stability.stable-fast-upscale-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](stable-image-services.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Inpaint
<a name="cross-region-ip-us.stability.stable-image-inpaint-v1:0"></a>

US Stable Image Inpaint 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-inpaint-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国安定イメージアウトペイント
<a name="cross-region-ip-us.stability.stable-outpaint-v1:0"></a>

US Stable Image Outpaint 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.stability.stable-outpaint-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](stable-image-services.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Remove Background
<a name="cross-region-ip-us.stability.stable-image-remove-background-v1:0"></a>

US Stable Image Remove Background 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-remove-background-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Search and Recolor
<a name="cross-region-ip-us.stability.stable-image-search-recolor-v1:0"></a>

US Stable Image Search and Recolor 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-search-recolor-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Search and Replace
<a name="cross-region-ip-us.stability.stable-image-search-replace-v1:0"></a>

US Stable Image Search and Replace 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-search-replace-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Style Guide
<a name="cross-region-ip-us.stability.stable-image-style-guide-v1:0"></a>

US Stable Image Style Guide 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-image-style-guide-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US Stable Image Style Transfer
<a name="cross-region-ip-us.stability.stable-style-transfer-v1:0"></a>

US Stable Image Style Transfer 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.stability.stable-style-transfer-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-stability-diffusion.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国 TwelveLabs Marengo Embed 3.0
<a name="cross-region-ip-us.twelvelabs.marengo-embed-3-0-v1:0"></a>

US TwelveLabs Marengo Embed 3.0 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.twelvelabs.marengo-embed-3-0-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-marengo.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 

### US TwelveLabs Marengo Embed v2.7
<a name="cross-region-ip-us.twelvelabs.marengo-embed-2-7-v1:0"></a>

US TwelveLabs Marengo Embed v2.7 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us.twelvelabs.marengo-embed-2-7-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-marengo.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 

### 米国ライターのパルミラ X4
<a name="cross-region-ip-us.writer.palmyra-x4-v1:0"></a>

US Writer Palmyra X4 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.writer.palmyra-x4-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-writer-palmyra.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### 米国ライターのパルミラ X5
<a name="cross-region-ip-us.writer.palmyra-x5-v1:0"></a>

US Writer Palmyra X5 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us.writer.palmyra-x5-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-writer-palmyra.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-east-1 |  us-east-1 us-east-2 us-west-2  | 
| us-east-2 |  us-east-1 us-east-2 us-west-2  | 
| us-west-1 |  us-east-1 us-east-2 us-west-1 us-west-2  | 
| us-west-2 |  us-east-1 us-east-2 us-west-2  | 

### US-GOV Claude 3 Haiku
<a name="cross-region-ip-us-gov.anthropic.claude-3-haiku-20240307-v1:0"></a>

US-GOV Claude 3 Haiku 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us-gov.anthropic.claude-3-haiku-20240307-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-gov-east-1 |  us-gov-east-1 us-gov-west-1  | 

### US-GOV Claude 3.5 Sonnet
<a name="cross-region-ip-us-gov.anthropic.claude-3-5-sonnet-20240620-v1:0"></a>

US-GOV Claude 3.5 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us-gov.anthropic.claude-3-5-sonnet-20240620-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-gov-east-1 |  us-gov-east-1 us-gov-west-1  | 

### US-GOV Claude 3.7 Sonnet
<a name="cross-region-ip-us-gov.anthropic.claude-3-7-sonnet-20250219-v1:0"></a>

US-GOV Claude 3.7 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
us-gov.anthropic.claude-3-7-sonnet-20250219-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-gov-east-1 |  us-gov-east-1 us-gov-west-1  | 

### US-GOV Claude Sonnet 4.5
<a name="cross-region-ip-us-gov.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

US-GOV Claude Sonnet 4.5 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
us-gov.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| us-gov-east-1 |  us-gov-west-1  | 
| us-gov-west-1 |  us-gov-west-1  | 

### APAC Anthropic Claude 3 Haiku
<a name="cross-region-ip-apac.anthropic.claude-3-haiku-20240307-v1:0"></a>

APAC Anthropic Claude 3 Haiku 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-3-haiku-20240307-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 

### APAC Anthropic Claude 3 Sonnet
<a name="cross-region-ip-apac.anthropic.claude-3-sonnet-20240229-v1:0"></a>

APAC Anthropic Claude 3 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-3-sonnet-20240229-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 

### APAC Anthropic Claude 3.5 Sonnet
<a name="cross-region-ip-apac.anthropic.claude-3-5-sonnet-20240620-v1:0"></a>

APAC Anthropic Claude 3.5 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-3-5-sonnet-20240620-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-1 ap-southeast-2  | 

### APAC Anthropic Claude 3.5 Sonnet v2
<a name="cross-region-ip-apac.anthropic.claude-3-5-sonnet-20241022-v2:0"></a>

APAC Anthropic Claude 3.5 Sonnet v2 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-3-5-sonnet-20241022-v2:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 

### APAC Anthropic Claude 3.7 Sonnet
<a name="cross-region-ip-apac.anthropic.claude-3-7-sonnet-20250219-v1:0"></a>

APAC Anthropic Claude 3.7 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-3-7-sonnet-20250219-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-south-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2  | 

### APAC Claude Sonnet 4
<a name="cross-region-ip-apac.anthropic.claude-sonnet-4-20250514-v1:0"></a>

APAC Claude Sonnet 4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.anthropic.claude-sonnet-4-20250514-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-east-2 |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-south-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-southeast-4 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-5 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5  | 
| ap-southeast-7 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-7  | 
| me-central-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 me-central-1  | 

### APAC Nova Lite
<a name="cross-region-ip-apac.amazon.nova-lite-v1:0"></a>

APAC Nova Lite 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.amazon.nova-lite-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-east-2 |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-southeast-4 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-5 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5  | 
| ap-southeast-7 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-7  | 
| me-central-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 me-central-1  | 

### APAC Nova Micro
<a name="cross-region-ip-apac.amazon.nova-micro-v1:0"></a>

APAC Nova Micro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.amazon.nova-micro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-east-2 |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-southeast-5 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5  | 
| ap-southeast-7 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-7  | 
| me-central-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 me-central-1  | 

### APAC Nova Pro
<a name="cross-region-ip-apac.amazon.nova-pro-v1:0"></a>

APAC Nova Pro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.amazon.nova-pro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-east-2 |  ap-east-2 ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-south-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-southeast-1 ap-southeast-2  | 
| ap-southeast-3 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 
| ap-southeast-4 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 
| ap-southeast-5 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-5  | 
| ap-southeast-7 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 ap-southeast-7  | 
| me-central-1 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4 me-central-1  | 

### APAC Pegasus v1.2
<a name="cross-region-ip-apac.twelvelabs.pegasus-1-2-v1:0"></a>

APAC Pegasus v1.2 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.twelvelabs.pegasus-1-2-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-pegasus.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-4  | 

### APAC TwelveLabs Marengo Embed v2.7
<a name="cross-region-ip-apac.twelvelabs.marengo-embed-2-7-v1:0"></a>

APAC TwelveLabs Marengo Embed v2.7 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
apac.twelvelabs.marengo-embed-2-7-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-marengo.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-2 |  ap-northeast-1 ap-northeast-2 ap-northeast-3 ap-south-1 ap-south-2 ap-southeast-1 ap-southeast-2 ap-southeast-3 ap-southeast-4  | 

### AU AU Anthropic Claude Sonnet 4.5
<a name="cross-region-ip-au.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

AU AU Anthropic Claude Sonnet 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
au.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-southeast-2 |  ap-southeast-2 ap-southeast-4  | 
| ap-southeast-4 |  ap-southeast-2 ap-southeast-4  | 

### AU Anthropic Claude Haiku 4.5
<a name="cross-region-ip-au.anthropic.claude-haiku-4-5-20251001-v1:0"></a>

AU Anthropic Claude Haiku 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
au.anthropic.claude-haiku-4-5-20251001-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-southeast-2 |  ap-southeast-2 ap-southeast-4  | 
| ap-southeast-4 |  ap-southeast-2 ap-southeast-4  | 

### AU Anthropic Claude Opus 4.6
<a name="cross-region-ip-au.anthropic.claude-opus-4-6-v1"></a>

AU Anthropic Claude Opus 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
au.anthropic.claude-opus-4-6-v1
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-southeast-2 |  ap-southeast-2 ap-southeast-4  | 
| ap-southeast-4 |  ap-southeast-2 ap-southeast-4  | 

### AU Anthropic Claude Sonnet 4.6
<a name="cross-region-ip-au.anthropic.claude-sonnet-4-6"></a>

AU Anthropic Claude Sonnet 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
au.anthropic.claude-sonnet-4-6
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-southeast-2 |  ap-southeast-2 ap-southeast-4  | 
| ap-southeast-4 |  ap-southeast-2 ap-southeast-4  | 

### CA Nova Lite
<a name="cross-region-ip-ca.amazon.nova-lite-v1:0"></a>

CA Nova Lite 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
ca.amazon.nova-lite-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ca-central-1 |  ca-central-1 ca-west-1  | 
| ca-west-1 |  ca-central-1 ca-west-1  | 

### EU Amazon Nova 2 Lite
<a name="cross-region-ip-eu.amazon.nova-2-lite-v1:0"></a>

EU Amazon Nova 2 Lite 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
eu.amazon.nova-2-lite-v1:0
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Anthropic Claude 3 Haiku
<a name="cross-region-ip-eu.anthropic.claude-3-haiku-20240307-v1:0"></a>

EU Anthropic Claude 3 Haiku 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-3-haiku-20240307-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-west-1 eu-west-3  | 

### EU Anthropic Claude 3 Sonnet
<a name="cross-region-ip-eu.anthropic.claude-3-sonnet-20240229-v1:0"></a>

EU Anthropic Claude 3 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-3-sonnet-20240229-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-west-1 eu-west-3  | 

### EU Anthropic Claude 3.5 Sonnet
<a name="cross-region-ip-eu.anthropic.claude-3-5-sonnet-20240620-v1:0"></a>

EU Anthropic Claude 3.5 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-3-5-sonnet-20240620-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-west-1 eu-west-3  | 

### EU Anthropic Claude 3.7 Sonnet
<a name="cross-region-ip-eu.anthropic.claude-3-7-sonnet-20250219-v1:0"></a>

EU Anthropic Claude 3.7 Sonnet 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-3-7-sonnet-20250219-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 

### EU Anthropic Claude Haiku 4.5
<a name="cross-region-ip-eu.anthropic.claude-haiku-4-5-20251001-v1:0"></a>

EU Anthropic Claude Haiku 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-haiku-4-5-20251001-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Anthropic Claude Opus 4.5
<a name="cross-region-ip-eu.anthropic.claude-opus-4-5-20251101-v1:0"></a>

EU Anthropic Claude Opus 4.5 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-opus-4-5-20251101-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Anthropic Claude Opus 4.6
<a name="cross-region-ip-eu.anthropic.claude-opus-4-6-v1"></a>

EU Anthropic Claude Opus 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-opus-4-6-v1
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Anthropic Claude Sonnet 4.5
<a name="cross-region-ip-eu.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

EU Anthropic Claude Sonnet 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Anthropic Claude Sonnet 4.6
<a name="cross-region-ip-eu.anthropic.claude-sonnet-4-6"></a>

EU Anthropic Claude Sonnet 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-sonnet-4-6
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Claude Sonnet 4
<a name="cross-region-ip-eu.anthropic.claude-sonnet-4-20250514-v1:0"></a>

EU Claude Sonnet 4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.anthropic.claude-sonnet-4-20250514-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| il-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3 il-central-1  | 

### EU Cohere Embed v4
<a name="cross-region-ip-eu.cohere.embed-v4:0"></a>

EU Cohere Embed v4 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.cohere.embed-v4:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-embed.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU Meta Llama 3.2 1B Instruct
<a name="cross-region-ip-eu.meta.llama3-2-1b-instruct-v1:0"></a>

EU Meta Llama 3.2 1B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.meta.llama3-2-1b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-west-1 eu-west-3  | 

### EU Meta Llama 3.2 3B Instruct
<a name="cross-region-ip-eu.meta.llama3-2-3b-instruct-v1:0"></a>

EU Meta Llama 3.2 3B Instruct 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.meta.llama3-2-3b-instruct-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-meta.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-west-1 eu-west-3  | 

### EU Mistral Pixtral Large 25.02
<a name="cross-region-ip-eu.mistral.pixtral-large-2502-v1:0"></a>

EU Mistral Pixtral Large 25.02 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.mistral.pixtral-large-2502-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-mistral.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 

### EU Nova Lite
<a name="cross-region-ip-eu.amazon.nova-lite-v1:0"></a>

EU Nova Lite 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.amazon.nova-lite-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| il-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3 il-central-1  | 

### EU Nova Micro
<a name="cross-region-ip-eu.amazon.nova-micro-v1:0"></a>

EU Nova Micro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.amazon.nova-micro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| il-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3 il-central-1  | 

### EU Nova Pro
<a name="cross-region-ip-eu.amazon.nova-pro-v1:0"></a>

EU Nova Pro 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.amazon.nova-pro-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](https://docs.aws.amazon.com/nova/latest/userguide/getting-started-schema.html)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-west-1 eu-west-3  | 
| il-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-west-1 eu-west-3 il-central-1  | 

### EU TwelveLabs Marengo Embed 3.0
<a name="cross-region-ip-eu.twelvelabs.marengo-embed-3-0-v1:0"></a>

EU TwelveLabs Marengo Embed 3.0 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
eu.twelvelabs.marengo-embed-3-0-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-marengo.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU TwelveLabs Marengo Embed v2.7
<a name="cross-region-ip-eu.twelvelabs.marengo-embed-2-7-v1:0"></a>

EU TwelveLabs Marengo Embed v2.7 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.twelvelabs.marengo-embed-2-7-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-marengo.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### EU TwelveLabs Pegasus v1.2
<a name="cross-region-ip-eu.twelvelabs.pegasus-1-2-v1:0"></a>

EU TwelveLabs Pegasus v1.2 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
eu.twelvelabs.pegasus-1-2-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-pegasus.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| eu-central-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-central-2 |  eu-central-1 eu-central-2 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-north-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-south-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-1 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 
| eu-west-2 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-2 eu-west-3  | 
| eu-west-3 |  eu-central-1 eu-north-1 eu-south-1 eu-south-2 eu-west-1 eu-west-3  | 

### JP Amazon Nova 2 Lite
<a name="cross-region-ip-jp.amazon.nova-2-lite-v1:0"></a>

JP Amazon Nova 2 Lite 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
jp.amazon.nova-2-lite-v1:0
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-3  | 

### JP Anthropic Claude Haiku 4.5
<a name="cross-region-ip-jp.anthropic.claude-haiku-4-5-20251001-v1:0"></a>

JP Anthropic Claude Haiku 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
jp.anthropic.claude-haiku-4-5-20251001-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-3  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-3  | 

### JP Anthropic Claude Sonnet 4.5
<a name="cross-region-ip-jp.anthropic.claude-sonnet-4-5-20250929-v1:0"></a>

JP Anthropic Claude Sonnet 4.5 推論プロファイルを呼び出すには、いずれかの送信元リージョンで次の推論プロファイル ID を指定します。

```
jp.anthropic.claude-sonnet-4-5-20250929-v1:0
```

このモデルの推論パラメータの詳細については、[「リンク](model-parameters-claude.md)」を参照してください。

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-3  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-3  | 

### JP Anthropic Claude Sonnet 4.6
<a name="cross-region-ip-jp.anthropic.claude-sonnet-4-6"></a>

JP Anthropic Claude Sonnet 4.6 推論プロファイルを呼び出すには、ソースリージョンのいずれかで次の推論プロファイル ID を指定します。

```
jp.anthropic.claude-sonnet-4-6
```

次の表は、推論プロファイルを呼び出すことができる送信元リージョンと、リクエストをルーティングできる送信先リージョンを示しています。


| ソースリージョン | 送信先リージョン | 
| --- | --- | 
| ap-northeast-1 |  ap-northeast-1 ap-northeast-3  | 
| ap-northeast-3 |  ap-northeast-1 ap-northeast-3  | 

## アプリケーション推論プロファイルでサポートされているリージョンとモデル
<a name="inference-profiles-support-user"></a>

アプリケーション推論プロファイルは、以下のすべてのモデルに対して作成できます AWS リージョン。
+ ap-northeast-1
+ ap-northeast-2
+ ap-south-1
+ ap-southeast-1
+ ap-southeast-2
+ ca-central-1
+ eu-central-1
+ eu-west-1
+ eu-west-2
+ eu-west-3
+ sa-east-1
+ us–east–1
+ us-east-2
+ us-gov-east-1
+ us-west-2

アプリケーション推論プロファイルは、Amazon Bedrock でサポートされているすべてのモデルと推論プロファイルから作成できます。Amazon Bedrock でサポートされるモデルの詳細については、「[Amazon Bedrock でサポートされている基盤モデル](models-supported.md)」を参照してください。

# 推論プロファイルの前提条件
<a name="inference-profiles-prereq"></a>

クロスリージョン推論を使用する前に、次の前提条件を満たしていることを確認してください。
+ 使用するロールに、クロスリージョン推論 API アクションへのアクセス権限があること。ロールに [AmazonBedrockFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonBedrockFullAccess)AWS 管理ポリシーがアタッチされている場合は、このステップをスキップできます。それ以外の場合は以下の作業を行います。

  1. 「[IAM ポリシーを作成する](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html)」の手順に従って、次のポリシーを作成します。このポリシーにより、ロールは推論プロファイル関連のアクションを実行でき、すべての基盤モデルと推論プロファイルを使用してモデル推論を実行できます。

------
#### [ JSON ]

****  

     ```
     {
         "Version":"2012-10-17",		 	 	 
         "Statement": [
             {
                 "Effect": "Allow",
                 "Action": [
                     "bedrock:InvokeModel*",
                     "bedrock:CreateInferenceProfile"
                 ],
                 "Resource": [
                     "arn:aws:bedrock:*::foundation-model/*",
                     "arn:aws:bedrock:*:*:inference-profile/*",
                     "arn:aws:bedrock:*:*:application-inference-profile/*"
                 ]
             },
             {
                 "Effect": "Allow",
                 "Action": [
                     "bedrock:GetInferenceProfile",
                     "bedrock:ListInferenceProfiles",
                     "bedrock:DeleteInferenceProfile",
                     "bedrock:TagResource",
                     "bedrock:UntagResource",
                     "bedrock:ListTagsForResource"
                 ],
                 "Resource": [
                     "arn:aws:bedrock:*:*:inference-profile/*",
                     "arn:aws:bedrock:*:*:application-inference-profile/*"
                 ]
             }
         ]
     }
     ```

------

     (オプション) ロールのアクセスは、次の方法で制限できます。
     + ロールが実行できる API アクションを制限するには、`Action` フィールドのリストを変更して、アクセスを許可する [API オペレーション](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-actions-as-permissions)のみを含めます。
     + 特定の推論プロファイルへのロールのアクセスを制限するには、アクセスを許可する[推論プロファイル](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies)と基盤モデルのみを含むように `Resource` リストを変更します。システム定義の推論プロファイルは `inference-profile` で始まり、アプリケーション推論プロファイルは `application-inference-profile` で始まります。
**重要**  
`Resource` フィールドで推論プロファイルを指定する場合は、プロファイルに関連付けられた、各リージョンでの基盤モデルも指定する必要があります。
     + 推論プロファイルを介してのみ基盤モデルを呼び出すことができるようにユーザーアクセスを制限するには、`Condition` フィールドを追加し、`aws:InferenceProfileArn` [条件キー ](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-policy-keys)を使用します。アクセスをフィルタリングする推論プロファイルを指定します。この条件は、`foundation-model` リソースを対象とするステートメントに含めることができます。
     + 例えば、次のポリシーをロールにアタッチすると、us-west-2 のアカウント *111122223333* の米国の Anthropic Claude 3 Haiku 推論プロファイルを介してのみ Anthropic Claude 3 Haiku モデルの呼び出しを許可できます。

------
#### [ JSON ]

****  

       ```
       {
           "Version":"2012-10-17",		 	 	 
           "Statement": [
               {
                   "Effect": "Allow",
                   "Action": [
                       "bedrock:InvokeModel*"
                   ],
                   "Resource": [
                       "arn:aws:bedrock:us-west-2:111122223333:inference-profile/us.anthropic.claude-3-haiku-20240307-v1:0"
                   ]
               },
               {
                   "Effect": "Allow",
                   "Action": [
                       "bedrock:InvokeModel*"
                   ],
                   "Resource": [
                       "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-3-haiku-20240307-v1:0",
                       "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0"
                   ],
                   "Condition": {
                       "StringLike": {
                           "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-west-2:111122223333:inference-profile/us.anthropic.claude-3-haiku-20240307-v1:0"
                       }
                   }
               }
           ]
       }
       ```

------
     + 例えば、次のポリシーをロールにアタッチすると、us-east-2 (米国東部 [オハイオ]) のアカウント 111122223333 のグローバル Claude Sonnet 4 推論プロファイルを介してのみ Anthropic Claude Sonnet 4 モデルの呼び出しを許可できます。

------
#### [ JSON ]

****  

       ```
       {
           "Version":"2012-10-17",		 	 	 
           "Statement": [
               {
                   "Effect": "Allow",
                   "Action": [
                       "bedrock:InvokeModel*"
                   ],
                   "Resource": [
                       "arn:aws:bedrock:us-east-2:111122223333:inference-profile/global.anthropic.claude-sonnet-4-20250514-v1:0"
                   ]
               },
               {
                   "Effect": "Allow",
                   "Action": [
                       "bedrock:InvokeModel*"
                   ],
                   "Resource": [
                       "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0",
                       "arn:aws:bedrock:::foundation-model/anthropic.claude-sonnet-4-20250514-v1:0"
                   ],
                   "Condition": {
                       "StringLike": {
                           "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-2:111122223333:inference-profile/global.anthropic.claude-sonnet-4-20250514-v1:0"
                       }
                   }
               }
           ]
       }
       ```

------
     + リクエストコンテキストキー `aws:RequestedRegion` が未指定であることを確認する `StringEquals` 条件で明示的な拒否を追加することで、グローバル Claude Sonnet 4 推論プロファイルの使用を制限することもできます。これは `StringEquals` と一致するため、拒否が許可を上書きして、推論リクエストのグローバルルーティングをブロックします。

       ```
       {
           "Effect": "Deny",
           "Action": [
               "bedrock:InvokeModel*"
           ],
           "Resource": "*",
           "Condition": {
               "StringEquals": {
                   "aws:RequestedRegion": "unspecified"
               }
           }
       },
       ```

  1. 「[IAM ID のアクセス許可の追加および削除](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html)」の手順に従って、ポリシーをロールにアタッチし、すべての推論プロファイルを表示および使用するアクセス許可をロールに付与します。
+ これで、推論プロファイルを呼び出すリージョンにおいて、使用する推論プロファイルで定義されたモデルへのアクセスをリクエストできました。

# アプリケーション推論プロファイルを作成する
<a name="inference-profiles-create"></a>

単一または複数のリージョンでアプリケーション推論プロファイルを作成して、モデルを呼び出す際に使用率とコストを追跡できます。
+ 単一のリージョンのアプリケーション推論プロファイルを作成するには、基盤モデルを指定します。そのモデルでそのリージョンに対して実行されたリクエストの使用率とコストが追跡されます。
+ 複数のリージョンのアプリケーション推論プロファイルを作成するには、クロスリージョン (システム定義) 推論プロファイルを指定します。推論プロファイルは、選択したクロスリージョン (システム定義) 推論プロファイルで定義されたリージョンにリクエストをルーティングします。推論プロファイルの複数のリージョンに対して実行されたリクエストの使用率とコストが追跡されます。

現時点では、推論プロファイルは Amazon Bedrock API を使用してのみ作成できます。

推論プロファイルを作成するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[CreateInferenceProfile](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateInferenceProfile.html) リクエストを送信します。

以下のフィールドが必要です。


****  

| フィールド | ユースケース | 
| --- | --- | 
| inferenceProfileName | 推論プロファイルの名前の指定に使用。 | 
| modelSource | コストと使用率を追跡するモデルとリージョンを定義する基盤モデルまたはクロスリージョン (システム定義) 推論プロファイルの指定に使用。 | 

次のフィールドはオプションです。


****  

| フィールド | ユースケース | 
| --- | --- | 
| 説明 | 推論プロファイルの説明の入力に使用。 | 
| タグ | 推論プロファイルへのタグのアタッチに使用。詳細については、[Amazon Bedrock リソースにタグ付け](tagging.md)「」および[「コスト配分タグを使用したAWSコストの整理と追跡](https://docs.aws.amazon.com//awsaccountbilling/latest/aboutv2/cost-alloc-tags.html)」を参照してください。 | 
| clientRequestToken | API リクエストが 1 回だけ完了するようにします。詳細については、「[べき等性の確保](https://docs.aws.amazon.com/ec2/latest/devguide/ec2-api-idempotency.html)」を参照してください。 | 

このレスポンスは、他の推論プロファイル関連アクションで使用できる `inferenceProfileArn` を返します。これは、モデルの呼び出しや Amazon Bedrock リソースでも使用できます。

# アプリケーション推論プロファイルのタグを変更する
<a name="inference-profiles-modify"></a>

アプリケーション推論プロファイルを作成した後でも、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[TagResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_TagResource.html) リクエストまたは [UntagResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_UntagResource.html) リクエストを送信し、`resourceArn` フィールドにアプリケーション推論プロファイルの ARN を指定することにより、Amazon Bedrock API を介してタグを管理できます。タグ付けの詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。

# 推論プロファイルに関する情報を表示する
<a name="inference-profiles-view"></a>

作成したクロスリージョン推論プロファイルまたはアプリケーション推論プロファイルに関する情報を表示できます。推論プロファイルの情報を表示する方法については、使用する方法に対応するタブを選択して、手順に従ってください。

------
#### [ Console ]

**クロスリージョン (システム定義) 推論プロファイルに関する情報を表示するには**

1. Amazon Bedrock コンソールを使用するためのアクセス許可を持つ IAM ID を使用して、AWS マネジメントコンソールにサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで **[クロスリージョン推論]** を選択します。次に、**[クロスリージョン推論]** セクションで、推論プロファイルを選択します。

1. 推論プロファイルの詳細は、**[推論プロファイルの詳細]** セクションで、プロファイルが包含するリージョンは、**[モデル]** で確認できます。

**注記**  
Amazon Bedrock コンソールでアプリケーション推論プロファイルを確認することはできません。

------
#### [ API ]

推論プロファイルに関する情報を取得するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[GetInferenceProfile](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetInferenceProfile.html) リクエストを送信します。`inferenceProfileIdentifier` フィールドには、推論プロファイルの Amazon リソースネーム (ARN) または ID を指定します。

使用可能な推論プロファイルの情報を一覧表示するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[ListInferenceProfiles](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListInferenceProfiles.html) を送信します。以下のオプションパラメータを指定できます。


****  

| フィールド | 簡単な説明 | 
| --- | --- | 
| maxResults | レスポンスとして返す結果の最大数。 | 
| nextToken | maxResults フィールドで指定した数よりも結果の件数が多い場合は、レスポンスで nextToken 値が返されます。結果の次のバッチを表示するには、別のリクエストで nextToken 値を送信します。 | 

------

# モデル呼び出しで推論プロファイルを使用する
<a name="inference-profiles-use"></a>

基盤モデルの代わりにクロスリージョン推論プロファイルを使用して、複数のリージョンにリクエストをルーティングできます。モデルのコストと使用状況を 1 つ以上のリージョンで追跡するには、アプリケーション推論プロファイルを使用します。モデル推論を実行する際に推論プロファイルを使用する方法については、希望する方法のタブを選択し、手順に従ってください。

------
#### [ Console ]

推論プロファイルをサポートする機能で推論プロファイルを使用するには、次の手順を実行します。

1. Amazon Bedrock コンソールを使用するためのアクセス許可を持つ IAM ID を使用して、AWS マネジメントコンソールにサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 推論プロファイルを使用する機能のページに移動します。例えば、左側のナビゲーションペインで **[チャット/テキストのプレイグラウンド]** を選択します。

1. **[モデルを選択]** を選択し、モデルを選択します。例えば、**[Amazon]**、**[Nova Premier]** の順に選択します。

1. **[推論]** で、ドロップダウンメニューから **[推論プロファイル]** を選択します。

1. 使用する推論プロファイル (**US Nova Premier** など) を選択し、**[適用]** を選択します。

------
#### [ API ]

推論プロファイルは、次の API オペレーションを使用して、そのプロファイルに含まれる任意のリージョンから推論を実行する際に使用できます。
+ [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) または [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) – モデル呼び出しで推論プロファイルを使用するには、「[InvokeModel で 1 つのプロンプトを送信する](inference-invoke.md)」の手順に従って、`modelId` フィールドに推論プロファイルの Amazon リソースネーム (ARN) を指定します。例については、「[Use an inference profile in model invocation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html#API_runtime_InvokeModel_Example_5)」を参照してください。
+ [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) または [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) – Converse API を使用したモデル呼び出しで推論プロファイルを使用するには、「[Converse API オペレーションを使用して会話を実行する](conversation-inference.md)」の手順に従って、`modelId` フィールドに推論プロファイルの ARN を指定します。例については、「[Use an inference profile in a conversation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html#API_runtime_Converse_Example_5)」を参照してください。
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) – ナレッジベースでのクエリの結果からレスポンスを生成する際に推論プロファイルを使用するには、「[クエリとレスポンスを使用してナレッジベースをテストする](knowledge-base-test.md)」の API タブの手順に従って、`modelArn` フィールドに推論プロファイルの ARN を指定します。詳細については、「[Use an inference proflie to generate a response](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html#API_agent-runtime_RetrieveAndGenerate_Example_3)」を参照してください。
+ [CreateEvaluationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateEvaluationJob.html) – モデル評価用に推論プロファイルを送信するには、「[Amazon Bedrock で自動モデル評価ジョブを開始する](model-evaluation-jobs-management-create.md)」の API タブの手順に従って、`modelIdentifier` フィールドに推論プロファイルの ARN を指定します。
+ [CreatePrompt](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreatePrompt.html) – プロンプト管理で作成したプロンプトのレスポンスを生成する際に推論プロファイルを使用するには、「[プロンプト管理を使用してプロンプトを作成する](prompt-management-create.md)」の API タブの手順に従って、`modelId` フィールドに推論プロファイルの ARN を指定します。
+ [CreateFlow](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateFlow.html) – フローのプロンプトノード内で定義したインラインプロンプトのレスポンスを生成する際に推論プロファイルを使用するには、「[Amazon Bedrock でフローを作成および設計する](flows-create.md)」の API タブの手順に従います。[プロンプトノード](flows-nodes.md#flows-nodes-prompt) の定義時に、`modelId` フィールドに推論プロファイルの ARN を指定します。
+ [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html) – データソースで非テキスト情報を解析する際に推論プロファイルを使用するには、「[データソースの解析オプション](kb-advanced-parsing.md)」の API セクションの手順に従って、`modelArn` フィールドに推論プロファイルの ARN を指定します。

**注記**  
クロスリージョン (システム定義) 推論プロファイルを使用している場合は、推論プロファイルの ARN またはID を使用できます。

------

# アプリケーション推論プロファイルを削除する
<a name="inference-profiles-delete"></a>

アプリケーションの推論プロファイルが不要になった場合は、削除できます。推論プロファイルは Amazon Bedrock API を介してのみ作成できます。

推論プロファイルを削除するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して、[DeleteInferenceProfile](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_DeleteInferenceProfiles.html) リクエストを送信します。`inferenceProflieIdentifier` フィールドには、削除する推論プロファイルの Amazon リソースネーム (ARN) または ID を指定します。

# Amazon Bedrock のプロビジョンドスループットでモデル呼び出し容量を増やす
<a name="prov-throughput"></a>

**スループット**とは、モデルが処理して返す入力と出力の数とレートを指します。**プロビジョンドスループット**を購入して、固定コストでモデルのより高いレベルのスループットをプロビジョニングできます。モデルをカスタマイズした場合は、そのモデルを使用するには、プロビジョンドスループットを購入する必要があります。

購入するプロビジョンドスループットは時間単位で請求されます。料金の詳細については、「[Amazon Bedrock 料金表](https://aws.amazon.com/bedrock/pricing)」を参照してください。1 時間あたりの料金は、以下の要因によって異なります。

1. 選択したモデル (カスタムモデルの場合、料金はカスタマイズ元のベースモデルと同じです)。

1. プロビジョンドスループットに指定したモデルユニット (MU) の数。MU は、指定されたモデルに対する特定のスループットレベルを提供します。MU のスループットレベルは、以下を指定します。
   + 1 分以内にすべてのリクエストに対して MU が処理できる入力トークンの数。
   + 1 分以内にすべてのリクエストに対して MU が生成できる出力トークンの数。
**注記**  
MU が指定する内容、MU あたりの料金、および制限の引き上げを AWS アカウント リクエストするには、マネージャーにお問い合わせください。

1. プロビジョンドスループットの維持にコミットする期間。コミットメント期間が長いほど、時間単位の料金が割引されます。次のコミットメントレベルから選択できます。
   + コミットメントなし – プロビジョンドスループットをいつでも削除できます。
   + 1 か月 – 1 か月のコミットメント期間が終了するまで、プロビジョンドスループットを削除することはできません。
   + 6 か月 – 6 か月のコミットメント期間が終了するまで、プロビジョンドスループットを削除することはできません。
**注記**  
プロビジョンドスループットを削除するまで、請求は続行されます。

以下のステップでは、プロビジョンドスループットのセットアップと使用のプロセスの概要を説明します。

1. プロビジョンドスループット用に購入する MU の数と、プロビジョンドスループットの使用をコミットする時間を決定します。

1. ベースまたはカスタムモデルのプロビジョンドスループットを購入します。

1. プロビジョンドモデルを作成したら、それを使用して[モデル推論 を実行できます](inference.md)。

**Topics**
+ [プロビジョンドスループットでサポートされているリージョンとモデル](prov-thru-supported.md)
+ [プロビジョンドスループットの前提条件](prov-thru-prereq.md)
+ [Amazon Bedrock モデルのプロビジョンドスループットを購入する](prov-thru-purchase.md)
+ [プロビジョンドスループットに関する情報を表示](prov-thru-info.md)
+ [プロビジョンドスループットを変更](prov-thru-edit.md)
+ [Amazon Bedrock リソースでプロビジョンドスループットを使用する](prov-thru-use.md)
+ [プロビジョンドスループットを削除するか、自動更新をキャンセルする](prov-thru-delete.md)
+ [プロビジョンドスループットのコード例](prov-thru-code-examples.md)

# プロビジョンドスループットでサポートされているリージョンとモデル
<a name="prov-thru-supported"></a>

Amazon Bedrock API を使用してプロビジョンドスループットを購入する場合は、モデル ID に Amazon Bedrock FM のコンテキストバリアントを指定する必要があります。

**注記**  
プロビジョンドスループットは、コミットなし購入のカスタムモデルでのみ AWS GovCloud (米国西部) でサポートされています。カスタムモデルのプロビジョンドスループットを購入する際は、該当モデルの ID を使用します。

次の表は、プロビジョンドスループットを購入できるモデル、プロビジョンドスループットを購入する際に使用するモデル ID、およびモデルのプロビジョンドスループットを購入 AWS リージョン できる を示しています。


| プロバイダー | モデル | モデル ID | 単一リージョンモデルのサポート | 
| --- | --- | --- | --- | 
| Amazon | ノバ 2 ライト | amazon.nova-2-lite-v1:0:256k |  us–east–1  | 
| Amazon | Nova Canvas | amazon.nova-canvas-v1:0 |  us–east–1  | 
| Amazon | Nova Lite | amazon.nova-lite-v1:0:24k |  us–east–1  | 
| Amazon | Nova Lite | amazon.nova-lite-v1:0:300k |  us–east–1  | 
| Amazon | Nova Micro | amazon.nova-micro-v1:0:128k |  us–east–1  | 
| Amazon | Nova Micro | amazon.nova-micro-v1:0:24k |  us–east–1  | 
| Amazon | Nova Pro | amazon.nova-pro-v1:0:24k |  us–east–1  | 
| Amazon | Nova Pro | amazon.nova-pro-v1:0:300k |  us–east–1  | 
| Amazon | Titan Embeddings G1 - Text | amazon.titan-embed-text-v1:2:8k |  us–east–1 us-west-2  | 
| Amazon | Titan Image Generator G1 v2 | amazon.titan-image-generator-v2:0 |  us–east–1 us-west-2  | 
| Amazon | Titan Multimodal Embeddings G1 | amazon.titan-embed-image-v1:0 |  ap-south-1 ap-southeast-2 ca-central-1 eu-central-1 eu-west-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  | 
| Anthropic | Claude | anthropic.claude-v2:0:100k |  us–east–1 us-west-2  | 
| Anthropic | Claude | anthropic.claude-v2:0:18k |  us–east–1 us-west-2  | 
| Anthropic | Claude | anthropic.claude-v2:1:18k |  eu-central-1 us–east–1 us-west-2  | 
| Anthropic | Claude | anthropic.claude-v2:1:200k |  eu-central-1 us–east–1 us-west-2  | 
| Anthropic | Claude 3 Haiku | anthropic.claude-3-haiku-20240307-v1:0:200k |  ap-southeast-2 eu-west-3 us–east–1 us-west-2  | 
| Anthropic | Claude 3 Haiku | anthropic.claude-3-haiku-20240307-v1:0:48k |  ap-south-1 ap-southeast-2 eu-west-1 eu-west-3 us–east–1 us-west-2  | 
| Anthropic | Claude 3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0:200k |  ap-southeast-2 eu-west-1 eu-west-3 us–east–1 us-west-2  | 
| Anthropic | Claude 3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0:28k |  ap-south-1 ap-southeast-2 eu-west-1 eu-west-3 us–east–1 us-west-2  | 
| Anthropic | Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0:18k |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0:200k |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0:51k |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0:18k |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0:200k |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0:51k |  us-west-2  | 
| Anthropic | Claude Instant | anthropic.claude-instant-v1:2:100k |  us–east–1 us-west-2  | 
| Cohere | Embed English | cohere.embed-english-v3:0:512 |  ca-central-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  | 
| Cohere | Embed Multilingual | cohere.embed-multilingual-v3:0:512 |  ca-central-1 eu-west-2 eu-west-3 sa-east-1 us–east–1 us-west-2  | 
| Meta | Llama 3.1 70B Instruct | meta.llama3-1-70b-instruct-v1:0:128k |  us-west-2  | 
| Meta | Llama 3.1 8B インストラクション | meta.llama3-1-8b-instruct-v1:0:128k |  us-west-2  | 
| Meta | Llama 3.2 11B 指示 | meta.llama3-2-11b-instruct-v1:0:128k |  us-west-2  | 
| Meta | Llama 3.2 1B 指示 | meta.llama3-2-1b-instruct-v1:0:128k |  us-west-2  | 
| Meta | Llama 3.2 3B インストラクション | meta.llama3-2-3b-instruct-v1:0:128k |  us-west-2  | 
| Meta | Llama 3.2 90B 指示 | meta.llama3-2-90b-instruct-v1:0:128k |  us-west-2  | 

**注記**  
次のモデルは、ベースモデルのコミットなし購入をサポートしていません。  
Titan Image Generator G1 V1
Titan Image Generator G1 V2

# プロビジョンドスループットの前提条件
<a name="prov-thru-prereq"></a>

プロビジョンドスループットを購入および管理する前に、以下の前提条件を満たす必要があります。

1. プロビジョンドスループットを購入する[モデルへのアクセスをリクエストします](model-access.md)。アクセスが許可されたら、ベースモデルとそのモデルからカスタマイズされたモデルのプロビジョンドスループットを購入できます。

1. IAM ロールがプロビジョンドスループット API アクションにアクセスできることを確認します。ロールに [AmazonBedrockFullAccess](security-iam-awsmanpol.md#security-iam-awsmanpol-AmazonBedrockFullAccess)AWS 管理ポリシーがアタッチされている場合は、このステップをスキップできます。それ以外の場合は以下の作業を行います。

   1. 「[IAM ポリシーの作成](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html)」のステップに従って、次のポリシーを作成します。これにより、ロールはすべての基盤モデルとカスタムモデルに対してプロビジョンドスループットを作成できます。

------
#### [ JSON ]

****  

      ```
      {
          "Version":"2012-10-17",		 	 	 
          "Statement": [
              {
                  "Sid": "PermissionsForProvisionedThroughput",
                  "Effect": "Allow",
                  "Action": [
                      "bedrock:GetFoundationModel",
                      "bedrock:ListFoundationModels",
                      "bedrock:GetCustomModel",
                      "bedrock:ListCustomModels",
                      "bedrock:InvokeModel",
                      "bedrock:InvokeModelWithResponseStream",
                      "bedrock:ListTagsForResource",
                      "bedrock:UntagResource",
                      "bedrock:TagResource",
                      "bedrock:CreateProvisionedModelThroughput",
                      "bedrock:GetProvisionedModelThroughput",
                      "bedrock:ListProvisionedModelThroughputs",
                      "bedrock:UpdateProvisionedModelThroughput",
                      "bedrock:DeleteProvisionedModelThroughput"
                  ],
                  "Resource": "*"
              }
          ]
      }
      ```

------
**注記**  
クロスリージョン推論でプロビジョンドスループットを使用している場合は、追加のアクセス許可が必要になる場合があります。詳細については、「[クロスリージョン推論によりスループットを向上させる](cross-region-inference.md)」を参照してください。

      (オプション) ロールのアクセスは、次の方法で制限できます。
      + ロールが実行できる API アクションを制限するには、 `Action` フィールドのリストを変更して、アクセスを許可する [API オペレーション](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-actions-as-permissions)のみを含めます。
      + プロビジョニングされたモデルを作成したら、アクセスを許可する[プロビジョニングされたモデル](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies)のみを含むように `Resource` リストを変更することで、プロビジョニングされたモデルで API リクエストを実行するロールの機能を制限できます。例については、[ユーザーにプロビジョニングされたモデルを呼び出すことを許可する](security_iam_id-based-policy-examples.md#security_iam_id-based-policy-examples-perform-actions-pt)を参照してください。
      + 特定の基盤モデルまたはカスタムモデルからプロビジョニングされたモデルを作成するロールの機能を制限するには、アクセスを許可する[基盤モデルとカスタムモデル](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html#amazonbedrock-resources-for-iam-policies)のみを含むように `Resource` リストを変更します。

   1. 「[IAM アイデンティティアクセス許可の追加と削除](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html)」のステップに従って、ロールアクセス許可を付与するロールにポリシーをアタッチします。

1. カスタマーマネージドAWS KMSキーで暗号化されたカスタムモデルのプロビジョンドスループットを購入する場合、IAM ロールにはキーを復号するアクセス許可が必要です。テンプレートは [カスタマーマネージドキーを作成する方法と、キーポリシーをアタッチする方法について](encryption-custom-job.md#encryption-key-policy) で使用できます。アクセス許可を最小限に抑えるには、*カスタムモデルユーザーのアクセス許可*ポリシーステートメントのみを使用できます。

# Amazon Bedrock モデルのプロビジョンドスループットを購入する
<a name="prov-thru-purchase"></a>

Amazon Bedrock には、トークン単位とモデル単位の 2 種類のプロビジョンドスループットがあります。購入するプロビジョンドスループットのタイプについては、次の手順を参照してください。

2 種類のプロビジョンドスループットの違いの詳細については、「」を参照してください[Amazon Bedrock のプロビジョンドスループットでモデル呼び出し容量を増やす](prov-throughput.md)。

## モデル単位によるプロビジョンドスループット
<a name="prov-thru-purchase-MUs"></a>

モデルのモデル単位によるプロビジョンドスループットを購入するときは、モデルのコミットメントのレベルと、割り当てるモデル単位 (MUs) の数を指定します。MU クォータについては、「AWS 全般のリファレンス」の「[Amazon Bedrock エンドポイントとクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html)」を参照してください。プロビジョンドスループット (コミットメントの有無にかかわらず) を購入する前に、まず [AWSサポートセンター](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase)にアクセスして、アカウントがプロビジョンドスループット間で分散されるように MUs をリクエストする必要があります。リクエストが付与されたら、プロビジョンドスループットを購入できます。

**注記**  
プロビジョンドスループットを購入した後、カスタムモデルに関連付けられている場合は、次のいずれかのオプションを指定してモデルを変更できます。  
カスタムモデルがカスタマイズされたベースモデル
カスタムモデルと同じベースモデルからカスタマイズされた別のカスタムモデル
カスタムモデルに関連付けられたプロビジョンドスループットの関連付けられたモデルのみを変更できます。

モデルのプロビジョンドスループットを購入する方法については、任意の方法のタブを選択し、ステップに従います。

------
#### [ Console ]

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで **[プロビジョンドスループット]** を選択します。

1. **[プロビジョンドスループット]** セクションで、**プロビジョンドスループットを購入]** を選択します。

1. **[プロビジョンドスループットの詳細]** セクションでは、以下を実行します。

   1. **[プロビジョンドスループット名]** フィールドに、プロビジョンドスループットの名前を入力します。

   1. **[モデルを選択]** で、ベースモデルプロバイダーまたはカスタムモデルカテゴリを選択します。次に、スループットをプロビジョニングするモデルを選択します。
**注記**  
コミットメントなしでプロビジョンドスループットを購入できるベースモデルを確認するには、サポートされているモデルのドキュメントを参照してください。  
AWS GovCloud (US)リージョンでは、コミットメントなしでカスタムモデルのプロビジョンドスループットのみを購入できます。

   1. (オプション) タグをプロビジョンドスループットに関連付けるには、**[タグ]** セクションを展開し、**[新しいタグを追加]** を選択します。詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。

1. **プロビジョニングモードの場合は**、**モデル単位で** を選択します。

1. **[コミットメント期間とモデルユニット]** セクションで、以下を実行します。

   1. [コミットメント期間を選択] セクションで、プロビジョンドスループットの使用をコミットする期間を選択します。

   1. **[モデルユニット]** フィールドに、必要なモデルユニット (MU) の数を入力します。コミットメントのあるモデルをプロビジョニングする場合は、まず [AWS サポートセンター](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase)にアクセスして、購入できる MU 数の増加をリクエストする必要があります。

1. **[プロビジョンドスループットを購入]** を選択します。

1. 表示される注記を確認し、チェックボックスを選択してコミットメント期間と価格を確認します。次に **[購入を確認する]** を選択します。

1. コンソールに **[プロビジョンドスループット]** の概要ページが表示されます。プロビジョンドスループットテーブルのプロビジョンドスループットの **[ステータス]** は **[作成中]** になります。プロビジョンドスループットの作成が完了すると、**[ステータス]** は **[サービス中]** になります。更新が失敗すると、**[ステータス]** は **[失敗]** になります。

------
#### [ API ]

プロビジョンドスループットを購入するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html) リクエストを送信します。

リクエスト本文の内容と、モデル単位によるプロビジョンドスループットを作成するために指定する必要があるパラメータの詳細については、*「Amazon Bedrock API リファレンス*」の[CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html)」を参照してください。

**注記**  
コミットメントなしでプロビジョンドスループットを購入できるベースモデルを確認するには、サポートされているモデルのドキュメントを参照してください。  
AWS GovCloud (US)リージョンでは、コミットメントなしでカスタムモデルのプロビジョンドスループットのみを購入できます。

レスポンスは `provisionedModelArn` を返し、それを[モデル推論](inference.md)で `modelId` として使用できます。プロビジョンドスループットの使用準備が整ったことを確認するには、[GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) リクエストを送信し、ステータスが「`InService`」であることを確認します。更新が失敗した場合、ステータスは `Failed` になり、[GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) レスポンスには `failureMessage` が含まれます。

[コード例を見る](prov-thru-code-examples.md)

------

# プロビジョンドスループットに関する情報を表示
<a name="prov-thru-info"></a>

購入したプロビジョンドスループットに関する情報を表示する方法については、任意の方法のタブを選択し、手順に従います。

------
#### [ Console ]

**プロビジョンドスループットに関する情報を表示するには**

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソール を使用して にサインインします。次に、[https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock) で Amazon Bedrock コンソールを開きます。

1. 左側のナビゲーションペインから**プロビジョンドスループット**を選択します。

1. **[プロビジョンドスループット]** セクションから、プロビジョンドスループットを選択します。

1. プロビジョンドスループットの詳細を **[プロビジョンドスループットの概要]** セクションで表示し、**[タグ]** セクションでプロビジョンドスループットに関連付けられたタグを表示します。

------
#### [ API ]

特定のプロビジョンドスループットに関する情報を取得するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) リクエストを送信します。プロビジョンドスループットの名前または ARN を `provisionedModelId` として指定します。

アカウント内のすべてのプロビジョンドスループットに関する情報を一覧表示するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [ListProvisionedModelThroughputs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListProvisionedModelThroughputs.html) リクエストを送信します。返される結果の数を制御するには、以下のオプションパラメータを指定します。


****  

| フィールド | 簡単な説明 | 
| --- | --- | 
| maxResults | レスポンスとして返す結果の最大数。 | 
| nextToken | maxResults フィールドで指定した数よりも結果の件数が多い場合は、レスポンスで nextToken 値が返されます。結果の次のバッチを表示するには、別のリクエストで nextToken 値を送信します。 | 

結果をソートおよびフィルタリングするために指定できるその他のオプションパラメータについては、「[ListProvisionedModelThroughputs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListProvisionedModelThroughputs.html)」を参照してください。

プロビジョンドスループットのすべてのタグを一覧表示するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [ListTagsForResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListTagsForResource.html) リクエストを送信し、プロビジョンドスループットの Amazon リソースネーム (ARN) を含めます。

[コード例を見る](prov-thru-code-examples.md)

------

# プロビジョンドスループットを変更
<a name="prov-thru-edit"></a>

購入後に編集できるプロビジョンドスループットの側面は、プロビジョニングモードによって異なります。モデル単位によるプロビジョンドスループットでは、プロビジョンドスループットの名前とタグのみを編集でき、カスタムモデルの場合はモデルを編集できます。

トークンによるプロビジョンドスループットでは、プロビジョンドスループットの 1 分あたりの入出力トークン数の変更など、より多くのオプションがあります。

変更するプロビジョンドスループットのタイプの編集の詳細については、以下のセクションを参照してください。

## モデル単位によるプロビジョンドスループットの変更
<a name="prov-thru-edit-MUs"></a>

既存のプロビジョンドスループットの名前またはタグを編集できます。

プロビジョンドスループットが関連付けられているモデルの変更には、次の制限が適用されます。
+ ベースモデルに関連付けられたプロビジョンドスループットのモデルを変更することはできません。
+ プロビジョンドスループットがカスタムモデルに関連付けられている場合、その関連付けを、カスタマイズ元のベースモデル、または同じベースモデルから派生した別のカスタムモデルに変更できます。

プロビジョンドスループットの更新中は、エンドカスタマーからの進行中のトラフィックを中断することなく、プロビジョンドスループットを使用して推論を実行できます。プロビジョンドスループットが関連付けられているモデルを変更した場合、更新が完全にデプロイされるまで、古いモデルから出力を受け取ることがあります。

プロビジョンドスループットを編集する方法については、任意の方法のタブを選択し、手順に従います。

------
#### [ Console ]

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで **[プロビジョンドスループット]** を選択します。

1. **[プロビジョンドスループット]** セクションから、プロビジョンドスループットを選択します。

1. **[編集]** を選択します。以下のフィールドを編集できます。
   + **[プロビジョンドスループット名]** – プロビジョンドスループットの名前を変更します。
   + **[モデルを選択]** – プロビジョンドスループットがカスタムモデルに関連付けられている場合は、関連付けられたモデルを変更できます。

1. **[タグ]** セクションで、プロビジョンドスループットに関連付けられたタグを編集できます。詳細については、「[Amazon Bedrock リソースにタグ付け](tagging.md)」を参照してください。

1. 変更を保存するには、**[編集を保存]** を選択します。

1. コンソールに **[プロビジョンドスループット]** の概要ページが表示されます。プロビジョンドスループットテーブルのプロビジョンドスループットの **[ステータス]** が **[更新中]** になります。プロビジョンドスループットの更新が完了すると、**[ステータス]** は **[サービス中]** になります。更新が失敗すると、**[ステータス]** は **[失敗]** になります。

------
#### [ API ]

プロビジョンドスループットを編集するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [UpdateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_UpdateProvisionedModelThroughput.html) リクエストを送信します。

リクエスト本文と指定する必要があるパラメータの詳細については、*Amazon Bedrock API リファレンス*の[UpdateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_UpdateProvisionedModelThroughput.html)」を参照してください。

アクションが成功すると、レスポンスは HTTP 200 ステータスレスポンスを返します。プロビジョンドスループットの使用準備が整ったことを確認するには、[GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) リクエストを送信し、ステータスが `InService` であることを確認します。ステータスが `Updating` の間は、プロビジョンドスループットを更新または削除することはできません。更新が失敗した場合、ステータスは `Failed` になり、[GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) レスポンスには `failureMessage` が含まれます。

プロビジョンドスループットにタグを追加するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [TagResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_TagResource.html) リクエストを送信し、プロビジョンドスループットの Amazon リソースネーム (ARN) を含めます。リクエスト本文には、各タグに指定したキーと値のペアを含むオブジェクトである `tags` フィールドが含まれています。

プロビジョンドスループットからタグを削除するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [UntagResource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_UntagResource.html) リクエストを送信し、プロビジョンドスループットの Amazon リソースネーム (ARN) を含めます。`tagKeys` リクエストパラメータは、削除するタグのキーを含むリストです。

[コード例を見る](prov-thru-code-examples.md)

------

# Amazon Bedrock リソースでプロビジョンドスループットを使用する
<a name="prov-thru-use"></a>

プロビジョンドスループットを購入したら、次の機能で使用できます。
+ **モデル推論** — Amazon Bedrock コンソールのプレイグラウンドでプロビジョンドスループットをテストできます。プロビジョンドスループットをデプロイする準備ができたら、プロビジョニングされたモデルを呼び出すようにアプリケーションをセットアップします。任意の方法のタブを選択し、その手順に従います。

------
#### [ Console ]

**Amazon Bedrock コンソールのプレイグラウンドでプロビジョンドスループットを使用するには**

  1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

  1. 左側のナビゲーションペインから、ユースケースに応じて、**[プレイグラウンド]** の **[チャット]**、**[テキスト]**、または**[イメージ]** を選択します。

  1. **[モデルを選択]** を選択します。

  1. **[1.] で。[カテゴリ]** 列で、プロバイダーまたはカスタムモデルカテゴリを選択します。次に、**[2.] で [モデル]** 列で、プロビジョンドスループットが関連付けられているモデルを選択します。

  1. **[3.] で [スループット]** 列で、プロビジョンドスループットを選択します。

  1. **[Apply]** (適用) を選択します。

  Amazon Bedrock プレイグラウンドの使用方法については、「[Generate responses in the console using playgrounds](playgrounds.md)」を参照してください。

------
#### [ API ]

  プロビジョンドスループットを使用して推論を実行するには、[Amazon Bedrock ランタイムエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt)を使用して [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)、[InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)、[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html)、または [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) リクエストを送信します。`modelId` パラメータとして、プロビジョンドモデルの ARN を指定します。さまざまなモデルのリクエスト本文の要件を確認するには、「[Inference request parameters and response fields for foundation models](model-parameters.md)」を参照してください。

  [コード例を見る](prov-thru-code-examples.md)

------
+ **プロビジョンドスループットをエージェントエイリアスに関連付ける** – エージェントエイリアスを[作成](agents-deploy.md)または[更新](agents-alias-edit.md)するときに、プロビジョンドスループットを関連付けることができます。Amazon Bedrock コンソールで、エイリアスを設定または編集する際に、プロビジョンドスループットを選択します。Amazon Bedrock API では、[CreateAgentAlias](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgentAlias.html) または [UpdateAgentAlias](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_UpdateAgentAlias.html) リクエストを送信する際に、`routingConfiguration` で `provisionedThroughput` を指定します。

# プロビジョンドスループットを削除するか、自動更新をキャンセルする
<a name="prov-thru-delete"></a>

プロビジョンドスループットは、各コミットメント期間の終了時に自動的に更新され、現在の入出力トークン設定が維持されます。

プロビジョンドスループットを維持しない場合は、それを削除するか、トークンによるプロビジョンドスループットの場合は自動更新をキャンセルして、現在の期間が終了したときに更新されないようにすることができます。

## プロビジョンドスループットの削除
<a name="prov-thru-delete-del"></a>

プロビジョンドスループットを削除すると、購入したスループットレベルでモデルを呼び出すことができなくなります。カスタムモデルに関連付けられたプロビジョンドスループットを削除しても、カスタムモデルは削除されません。カスタムモデルを削除する方法については、「[Delete a custom model](model-customization-delete.md)」を参照してください。

**注記**  
コミットメント期間が完了する前に、コミットメントを持つモデルユニットによるプロビジョンドスループットを削除することはできません。

プロビジョンドスループットを削除する方法については、任意の方法のタブを選択し、手順に従います。

------
#### [ Console ]

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで **[プロビジョンドスループット]** を選択します。

1. **[プロビジョンドスループット]** セクションから、プロビジョンドスループットを選択します。

1. **アクション**ドロップダウンメニューから**削除**を選択します。

1. コンソールに、完全な削除が行われることを警告するモーダルフォームが表示されます。**[確認]** を選択して続行します。

1. プロビジョンドスループットはすぐに削除されます。

------
#### [ API ]

プロビジョンドスループットを削除するには、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [DeleteProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_DeleteProvisionedModelThroughput.html) リクエストを送信します。プロビジョンドスループットの名前または ARN を `provisionedModelId` として指定します。削除が成功すると、レスポンスは HTTP 200 ステータスコードを返します。

[コード例を見る](prov-thru-code-examples.md)

------

## プロビジョンドスループットの自動更新のキャンセル
<a name="prov-thru-delete-cancel-auto-renew"></a>

トークンによるプロビジョンドスループットの場合、コミットメント期間が終了する前の任意の時点で自動更新をキャンセルして、プロビジョンドスループットが自動的に更新されないようにできます。

自動更新をキャンセルした場合、プロビジョンドスループットはコミットメント期間が終了するまで稼働し続けます。推論を実行するかどうかにかかわらず、現在の期間のプロビジョニング料金の全額が請求されます。

プロビジョンドスループットの自動更新をキャンセルした後は、コミットメント期間の残りの期間、プロビジョンドスループットをさらに変更することはできません。

**注記**  
自動更新は、キャンセル後に再度有効にすることはできません。現在の期間が終了した後にプロビジョンドスループットが必要な場合は、新しいプロビジョンドスループットを購入する必要があります。

トークンによるプロビジョンドスループットの自動更新をキャンセルする方法については、任意の方法のタブを選択し、ステップに従います。

------
#### [ Console ]

1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソールを使用して にサインインします。Amazon Bedrock コンソール ([https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock)) を開きます。

1. 左側のナビゲーションペインで **[プロビジョンドスループット]** を選択します。

1. **[プロビジョンドスループット]** セクションから、プロビジョンドスループットを選択します。

1. **アクション**ドロップダウンメニューから**自動更新をキャンセル**を選択します。

1. コンソールにモーダルフォームが表示され、このアクションを元に戻すことができないことを警告します。**[確認]** を選択して続行します。

1. プロビジョンドスループットは、現在のコミットメント期間が終了するまでアクティブのままになり、その後自動的に削除されます。

------
#### [ API ]

プロビジョンドスループットの自動更新をキャンセルするには、 `disableAutoRenew`パラメータを に設定して、[Amazon Bedrock コントロールプレーンエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-cp)を使用して [UpdateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_UpdateProvisionedModelThroughput.html) リクエストを送信します`true`。プロビジョンドスループットは、現在のコミットメント期間が終了するまでアクティブのままになります。

[コード例を見る](prov-thru-code-examples.md)

------

# プロビジョンドスループットのコード例
<a name="prov-thru-code-examples"></a>

次のコード例は、 と Python SDK を使用してプロビジョンドスループットを作成する方法と、プロビジョンドスループットを管理AWS CLIおよび呼び出す方法を示しています。プロビジョニングされたスループットは、基盤モデルまたは既にカスタマイズしたモデルから作成できます。開始する前に、次の前提条件を実行します。

**前提条件**

次の例では、Amazon Nova Liteモデル ID が であるモデルを使用します`amazon.nova-lite-v1:0:24k`。まだの場合は、「」の手順に従って へのアクセスAmazon Nova Liteをリクエストします[SDK と CLI を使用してモデルアクセスを管理する](model-access.md#model-access-modify)。

別の基盤モデルまたはカスタムモデルのプロビジョンドスループットを購入する場合は、以下を実行する必要があります。

1. 次のいずれかを実行して、モデルの ID (基盤モデルの場合）、名前 (カスタムモデルの場合）、または ARN (いずれかの場合) を見つけます。
   + 基盤モデルのプロビジョンドスループットを購入する場合は、次のいずれかの方法でプロビジョニングをサポートするモデルの ID または Amazon リソースネーム (ARN) を見つけます。
     + テーブルの値を検索します。
     + [ListFoundationModels](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListFoundationModels.html) リクエストを送信し、 として`byInferenceType`値を指定`PROVISIONED`して、プロビジョニングをサポートするモデルのリストを表示します。`modelId` または `modelArn`フィールドの値を見つけます。
   + カスタムモデルのプロビジョンドスループットを購入する場合は、次のいずれかの方法でカスタマイズしたモデルの名前または Amazon リソースネーム (ARN) を見つけます。
     + Amazon Bedrock コンソールで、左側のナビゲーションペインから**カスタムモデル**を選択します。カスタマイズされたモデルの名前を**モデル**リストで検索するか、それを選択してモデル**の詳細でモデル** **ARN** を見つけます。
     + [ListCustomModels](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_ListCustomModels.html) リクエストを送信し、レスポンスでカスタムモデルの `modelName`または `modelArn`値を見つけます。

1. 以下の例の [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) リクエスト`body`の を変更して、 で見つけてモデルの本文の形式に一致させます[Inference request parameters and response fields for foundation models](model-parameters.md)。

任意の方法のタブを選択し、その手順に従います。

------
#### [ AWS CLI ]

1. ターミナルで次のコマンドを実行して、[CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html) リクエストを送信し、*MyPT* という非コミットプロビジョンドスループットを作成します。

   ```
   aws bedrock create-provisioned-model-throughput \
      --model-units 1 \
      --provisioned-model-name MyPT \
      --model-id amazon.nova-lite-v1:0:24k
   ```

1. レスポンスは `provisioned-model-arn` を返します。作成が完了するまでしばらく待ちます。ステータスを確認するには、[GetProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_GetProvisionedModelThroughput.html) リクエストを送信し`provisioned-model-id`、次のコマンドを実行して、プロビジョニングされたモデルの名前または ARN を として指定します。

   ```
   aws bedrock get-provisioned-model-throughput \
       --provisioned-model-id ${provisioned-model-arn}
   ```

1. [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) リクエストを送信して、プロビジョニングされたモデルで推論を実行します。`CreateProvisionedModelThroughput` レスポンスで返されたプロビジョニング済みモデルの ARN を として指定します`model-id`。出力は、現在のフォルダの *output.txt* という名前のファイルに書き込まれます。

   ```
   aws bedrock-runtime invoke-model \
       --model-id ${provisioned-model-arn} \
       --body '{
                   "messages": [{
                       "role": "user",
                       "content": [{
                           "text": "Hello"
                       }]
                   }],
                   "inferenceConfig": {
                       "temperature":0.7
                   }
               }' \
       --cli-binary-format raw-in-base64-out \
       output.txt
   ```

1. 次のコマンドを使用して [DeleteProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_DeleteProvisionedModelThroughput.html) リクエストを送信し、プロビジョンドスループットを削除します。プロビジョンドスループットの料金は発生しなくなります。

   ```
   aws bedrock delete-provisioned-model-throughput 
     --provisioned-model-id MyPT
   ```

------
#### [ Python (Boto) ]

次のコードスニペットでは、プロビジョンドスループットを作成してその情報を取得し、プロビジョンドスループットを呼び出す方法について説明します。

1. *MyPT* という非コミットプロビジョンドスループットを作成し、プロビジョンドスループットの ARN を *provisioned\$1model\$1arn* という変数に割り当てるには、次の [CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html) リクエストを送信します。

   ```
   import boto3 
   
   provisioned_model_name = 'MyPT'
   
   bedrock = boto3.client(service_name='bedrock')
   response = bedrock.create_provisioned_model_throughput(
       modelUnits=1,
       provisionedModelName=provisioned_model_name, 
       modelId='amazon.nova-lite-v1:0:24k' 
   )
                           
   provisioned_model_arn = response['provisionedModelArn']
   ```

1. 作成が完了するまでしばらく待ちます。次のコードスニペットを使用して、ステータスを確認します。[CreateProvisionedModelThroughput](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateProvisionedModelThroughput.html) レスポンスから返されるプロビジョンドスループットの名前または ARN を `provisionedModelId` として指定できます。

   ```
   bedrock.get_provisioned_model_throughput(provisionedModelId=provisioned_model_name)
   ```

1. 次のコマンドを使用し、プロビジョニングされたモデルの ARN を として使用して、更新されたプロビジョニングされたモデルで推論を実行します`modelId`。

   ```
   import json
   import logging
   import boto3
   
   from botocore.exceptions import ClientError
   
   
   class ImageError(Exception):
       "Custom exception for errors returned by the model"
   
       def __init__(self, message):
           self.message = message
   
   
   logger = logging.getLogger(__name__)
   logging.basicConfig(level=logging.INFO)
   
   
   def generate_text(model_id, body):
       """
       Generate text using your provisioned custom model.
       Args:
           model_id (str): The model ID to use.
           body (str) : The request body to use.
       Returns:
           response (json): The response from the model.
       """
   
       logger.info(
           "Generating text with your provisioned custom model %s", model_id)
   
       brt = boto3.client(service_name='bedrock-runtime')
   
       accept = "application/json"
       content_type = "application/json"
   
       response = brt.invoke_model(
           body=body, modelId=model_id, accept=accept, contentType=content_type
       )
       response_body = json.loads(response.get("body").read())
   
       finish_reason = response_body.get("error")
   
       if finish_reason is not None:
           raise ImageError(f"Text generation error. Error is {finish_reason}")
   
       logger.info(
           "Successfully generated text with provisioned custom model %s", model_id)
   
       return response_body
   
   
   def main():
       """
       Entrypoint for example.
       """
       try:
           logging.basicConfig(level=logging.INFO,
                               format="%(levelname)s: %(message)s")
   
           model_id = provisioned-model-arn
   
           body = json.dumps({
               "inputText": "what isAWS?"
           })
   
           response_body = generate_text(model_id, body)
           print(f"Input token count: {response_body['inputTextTokenCount']}")
   
           for result in response_body['results']:
               print(f"Token count: {result['tokenCount']}")
               print(f"Output text: {result['outputText']}")
               print(f"Completion reason: {result['completionReason']}")
   
       except ClientError as err:
           message = err.response["Error"]["Message"]
           logger.error("A client error occurred: %s", message)
           print("A client error occured: " +
                 format(message))
       except ImageError as err:
           logger.error(err.message)
           print(err.message)
   
       else:
           print(
               f"Finished generating text with your provisioned custom model {model_id}.")
   
   
   if __name__ == "__main__":
       main()
   ```

1. 次のコードスニペットを使用して、プロビジョンドスループットを削除します。プロビジョンドスループットの料金は発生しなくなります。

   ```
   bedrock.delete_provisioned_model_throughput(provisionedModelId=provisioned_model_name)
   ```

------

# Amazon Bedrock のクォータ
<a name="quotas"></a>

 AWS アカウント には、Amazon Bedrock の制限と呼ばれるデフォルトのクォータがあります。Amazon Bedrock のサービスクォータを表示するには、次のいずれかを実行します。
+ 「[サービスクォータの表示](https://docs.aws.amazon.com/servicequotas/latest/userguide/gs-request-quota.html)」のステップに従って、サービスとして **[Amazon Bedrock]** を選択します。
+ 「 AWS 全般のリファレンス」の「[Amazon Bedrock サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)」を参照してください。

Amazon Bedrock のモデル推論は、トークン使用率のクォータによって制御されます。モデルによっては、より高い率でトークンを使用します。これらの使用率とトークンの使用状況を最適化する方法の詳細については、「[Amazon Bedrock でのトークンのカウント方法](quotas-token-burndown.md)」を参照してください。

サービスのパフォーマンスを維持し、Amazon Bedrock を適切に使用するために、アカウントに割り当てられたデフォルトのクォータは、リージョンの要因、支払い履歴、不正使用、および/または[クォータ引き上げリクエスト](quotas-increase.md)の承認に応じて更新される場合があります。

**Topics**
+ [Amazon Bedrock でのトークンのカウント方法](quotas-token-burndown.md)
+ [推論を実行する前にトークンをカウントしてトークンの使用量をモニタリングする](count-tokens.md)
+ [Amazon Bedrock クォータの引き上げをリクエストする](quotas-increase.md)

# Amazon Bedrock でのトークンのカウント方法
<a name="quotas-token-burndown"></a>

モデル推論を実行する場合、使用する Amazon Bedrock モデルに応じて処理できるトークンの数にはクォータがあります。トークンのクォータに関連する次の用語を確認してください。


****  

| 用語 | 定義 | 
| --- | --- | 
| InputTokenCount | モデルへの入力として提供されたリクエスト内のトークンの数を表す CloudWatch Amazon Bedrock ランタイムメトリクス。 | 
| OutputTokenCount | リクエストに応じてモデルにより生成されたトークンの数を表す CloudWatch Amazon Bedrock ランタイムメトリクス。 | 
| CacheReadInputTokens | モデルによって再処理されるのではなく、キャッシュから正常に取得された入力トークンの数を表す CloudWatch Amazon Bedrock ランタイムメトリクス。この値は、[プロンプトキャッシュ](prompt-caching.md)を使用しない場合は 0 になります。 | 
| CacheWriteInputTokens | キャッシュに正常に書き込まれた入力トークンの数を表す CloudWatch Amazon Bedrock ランタイムメトリクス。この値は、[プロンプトキャッシュ](prompt-caching.md)を使用しない場合は 0 になります。 | 
| 1 分あたりのトークン数 (TPM) | 1 分間 AWS で使用できるトークンの数 (入力と出力の両方を含む) のモデルレベルで によって設定されたクォータ。 | 
| 1 日あたりのトークン数 (TPD) | 1 日に使用できるトークンの数 (入力と出力の両方を含む) のモデルレベルで AWS によって設定されたクォータ。デフォルトでは、この値は TPM x 24 x 60 です。ただし、新しい AWS アカウント ではクォータが削減されました。 | 
| 1 分あたりのリクエスト数 (RPM) | 1 分間に送信できるリクエスト数に対してモデルレベルで AWS によって設定されたクォータ。 | 
| max\$1tokens | モデルが生成できる出力トークンの最大数を設定するためにリクエストで指定するパラメータ。 | 
| バーンダウンレート | 入力トークンと出力トークンがスロットリングシステムのトークンクォータ使用量に変換されるレート。 | 

Anthropic Claude モデルバージョン 3.7 以降のバーンダウンレートは、**出力トークンに対して 5 倍です** (1 つの出力トークンはクォータから 5 つのトークンを消費します）。

他のすべてのモデルの場合、バーンダウンレートは **1:1** になります (1 つの出力トークンはクォータから 1 つのトークンを消費します)。

**Topics**
+ [トークンクォータ管理について](#quotas-token-burndown-management)
+ [max\$1tokens パラメータの影響について](#quotas-token-burndown-max-tokens)
+ [max\$1tokens パラメータの最適化](#quotas-token-burndown-max-tokens-optimize)

## トークンクォータ管理について
<a name="quotas-token-burndown-management"></a>

リクエストを行うと、TPM および TPD クォータからトークンが差し引かれます。計算は次の段階で行われます。
+ **リクエストの開始時** – RPM クォータを超過していないと仮定して、次の合計がクォータから差し引かれます。クォータを超えると、リクエストはスロットリングされます。

  ```
  Total input tokens + max_tokens
  ```
+ **処理中** – リクエストによって消費されたクォータは、生成された出力トークンの実際の数を考慮して定期的に調整されます。
+ **リクエストの終了時** – リクエストによって消費されたトークンの合計数は次のように計算され、未使用のトークンがあればクォータに補充されます。

  ```
  InputTokenCount + CacheWriteInputTokens + (OutputTokenCount x burndown rate)
  ```

  [プロンプトキャッシュ](prompt-caching.md)を使用しない場合、`CacheWriteInputTokens` は 0 になります。`CacheReadInputTokens` はこの計算には影響しません。

**注記**  
実際のトークン使用量に対してのみ請求されます。  
例えば、Anthropic Claude Sonnet 4 を使用して、1,000 個の入力トークンを含むリクエストを送信し、100 個のトークンに相当する応答を生成する場合:  
**1,500 個のトークン** (1,000 \$1 100 x 5) が TPM クォータと TPD クォータから消費されます。
**1,100 個のトークン**に対してのみ請求されます。

## max\$1tokens パラメータの影響について
<a name="quotas-token-burndown-max-tokens"></a>

`max_tokens` 値は、各リクエストの開始時にクォータから差し引かれます。予想よりも早く TPM クォータに達している場合は、完了サイズにより近づくように、`max_tokens` を減らしてみてください。

次のシナリオでは、出力トークンのバーンダウンレートが 5 倍であるモデルを使用して、完了したリクエストについてクォータ控除がどのように影響したかの例を示します。

### シナリオ 1: max\$1tokens 値が高い
<a name="quotas-token-burndown-max-tokens-too-high"></a>

次のパラメータを想定します。
+ **InputTokenCount:** 3,000
+ **CacheReadInputTokens:** 4,000
+ **CacheWriteInputTokens:** 1,000
+ **OutputTokenCount:** 1,000
+ **max\$1tokens:** 32,000

次のクォータ控除が行われます。
+ **初回控除 (リクエスト作成時):** 40,000 (= 3,000 \$1 4,000 \$1 1,000 \$1 32,000)
+ **最終調整済み控除 (応答生成後):** 9,000 (= 3,000 \$1 1,000 \$1 1,000 x 5)

このシナリオでは、`max_tokens` パラメータの設定が高すぎるため、同時リクエスト数が少なくなる可能性があります。これにより、TPM クォータ容量にすぐに達するため、リクエストの同時実行、スループット、クォータ使用率が低下します。

### シナリオ 2: 最適化された max\$1tokens 値
<a name="quotas-token-burndown-max-tokens-optimized"></a>

次のパラメータを想定します。
+ **InputTokenCount:** 3,000
+ **CacheReadInputTokens:** 4,000
+ **CacheWriteInputTokens:** 1,000
+ **OutputTokenCount:** 1,000
+ **max\$1tokens:** 1,250

次のクォータ控除が行われます。
+ **初回控除 (リクエスト作成時)**: 9,250 (= 3,000 \$1 4,000 \$1 1,000 \$1 1,250)
+ **最終調整済み控除 (応答生成後):** 9,000 (= 3,000 \$1 1,000 \$1 1,000 x 5)

このシナリオでは、初期控除が最終調整済み控除よりもほんの少し高いため、`max_tokens` パラメータが最適化されました。これにより、リクエストの同時実行、スループット、クォータ使用率が向上しまました。

## max\$1tokens パラメータの最適化
<a name="quotas-token-burndown-max-tokens-optimize"></a>

`max_tokens` パラメータを最適化することで、割り当てられたクォータ容量を効率的に活用できます。このパラメータの決定を通知するために、Amazon CloudWatch を使用できます。Amazon CloudWatch は、Amazon Bedrock のトークン使用状況データなど、 AWS サービスからメトリクスを自動的に収集します。

トークンは `InputTokenCount` と `OutputTokenCount` のランタイムメトリクスに記録されます (その他のメトリクスについては、「[Amazon Bedrock ランタイムメトリクス](monitoring.md#runtime-cloudwatch-metrics)」を参照してください。

CloudWatch モニタリングを使用して `max_tokens` パラメータの決定を通知するには、 AWS マネジメントコンソールで以下を実行します。

1. [https://console.aws.amazon.com/cloudwatch](https://console.aws.amazon.com/cloudwatch) で Amazon CloudWatch コンソールにサインインします。

1. 左側のナビゲーションパネルで **[ダッシュボード]** を選択します。

1. **[自動ダッシュボード]** タブを選択します。

1. **[Bedrock]** を選択します。

1. **[モデル別のトークン数]** ダッシュボードで、展開アイコンを選択します。

1. ピーク使用量を考慮して、メトリクスの期間と範囲パラメータを選択します。

1. **[合計]** とラベル付けされたドロップダウンメニューから、異なるメトリクスを選択してトークンの使用量を観察できます。これらのメトリクスを調べて、`max_tokens` 値の設定に関する決定をガイドします。

# 推論を実行する前にトークンをカウントしてトークンの使用量をモニタリングする
<a name="count-tokens"></a>

モデル推論を実行する場合、入力で送信するトークンの数は、リクエストのコストと、1 分間および 1 日に使用できるトークンのクォータに影響します。[CountTokens](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_CountTokens.html) API は、推論リクエストで同じ入力がモデルに送信された場合に使用されるトークン数を返すため、基盤モデルにリクエストを送信する前にトークンの使用量を推定するのに役立ちます。

**注記**  
[CountTokens](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_CountTokens.html) API を使用しても料金は発生しません。

使用されるトークン化戦略はモデルによって異なるため、トークンのカウントはモデル固有です。このオペレーションによって返されるトークン数は、推論を実行するために同じ入力がモデルに送信された場合に課金対象となるトークン数と一致します。

`CountTokens` API を使用して、以下のことを実行できます。
+ 推論リクエストを送信する前にコストを見積もる。
+ トークンの制限内に収まるようにプロンプトを最適化する。
+ アプリケーションでのトークンの使用量を計画する。

**Topics**
+ [トークンのカウントでサポートされているモデルおよびリージョン](#count-tokens-supported)
+ [リクエスト内のトークンをカウントする](#count-tokens-use)
+ [例を試す](#count-tokens-example)

## トークンのカウントでサポートされているモデルおよびリージョン
<a name="count-tokens-supported"></a>

次の表は、トークンカウントの基盤モデルサポートを示しています。


| プロバイダー | モデル | モデル ID | 単一リージョンモデルのサポート | 
| --- | --- | --- | --- | 
| Anthropic | Claude 3.5 Haiku | anthropic.claude-3-5-haiku-20241022-v1:0 |  us-west-2  | 
| Anthropic | Claude 3.5 Sonnet | anthropic.claude-3-5-sonnet-20240620-v1:0 |  ap-northeast-1 ap-southeast-1 eu-central-1 eu-central-2 us-east-1 us-west-2  | 
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 |  ap-southeast-2 us-west-2  | 
| Anthropic | Claude 3.7 Sonnet | anthropic.claude-3-7-sonnet-20250219-v1:0 |  eu-west-2  | 
| Anthropic | Claude Opus 4 | anthropic.claude-opus-4-20250514-v1:0 |  | 
| Anthropic | Claude Sonnet 4 | anthropic.claude-sonnet-4-20250514-v1:0 |  | 

## リクエスト内のトークンをカウントする
<a name="count-tokens-use"></a>

推論リクエスト内の入力トークンの数をカウントするには、[Amazon Bedrock ランタイムエンドポイント](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#br-rt)を使用して [CountTokens](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_CountTokens.html) リクエストを送信します。モデルをヘッダーに指定し、トークンをカウントする入力を `body` フィールドに指定します。`body` フィールドの値は、[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) リクエストの入力トークンをカウントするのか、[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) リクエストの入力トークンをカウントするのかによって異なります。
+ `InvokeModel` リクエストの場合、`body` の形式は、指定したモデルによって異なる形式の JSON オブジェクトを表す文字列です。
+ `Converse` リクエストの場合、`body` の形式は、会話に含まれる `messages` プロンプトと `system` プロンプトを指定する JSON オブジェクトです。

## 例を試す
<a name="count-tokens-example"></a>

このセクションの例では、Anthropic Claude 3 Haiku を使用して `InvokeModel` リクエストと `Converse` リクエストのトークンをカウントします。

**前提条件**
+ ダウンロードするとAWS SDK for Python (Boto3)、認証情報とデフォルトのAWSリージョンが自動的に認識されるように設定が設定されます。
+ IAM アイデンティティに、次のアクションを行うためのアクセス許可が付与されていること (詳細については、「[Amazon Bedrock のアクション、リソース、条件キー](https://docs.aws.amazon.com/service-authorization/latest/reference/list_amazonbedrock.html)」を参照してください)。
  + bedrock:CountTokens – `CountTokens` の使用を許可します。
  + bedrock:InvokeModel – `InvokeModel` および `Converse` の使用を許可します。少なくとも *arn:\$1\$1Partition\$1:bedrock:\$1\$1Region\$1::foundation-model/anthropic.claude-3-haiku-20240307-v1:0* にスコープを設定する必要があります。

[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) リクエストのトークンのカウントを試すには、次の Python コードを実行します。

```
import boto3
import json

bedrock_runtime = boto3.client("bedrock-runtime")

input_to_count = json.dumps({
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 500,
    "messages": [
        {
            "role": "user",
            "content": "What is the capital of France?"
        }
    ]
})

response = bedrock_runtime.count_tokens(
    modelId="anthropic.claude-3-5-haiku-20241022-v1:0",
    input={
        "invokeModel": {
            "body": input_to_count
        }
    }
)

print(response["inputTokens"])
```

[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) リクエストのトークンのカウントを試すには、次の Python コードを実行します。

```
import boto3
import json 

bedrock_runtime = boto3.client("bedrock-runtime")

input_to_count = {
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "text": "What is the capital of France?"
                }
            ]
        },
        {
            "role": "assistant",
            "content": [
                {
                    "text": "The capital of France is Paris."
                }
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "text": "What is its population?"
                }
            ]
        }
    ],
    "system": [
        {
            "text": "You're an expert in geography."
        }
    ]
}

response = bedrock_runtime.count_tokens(
    modelId="anthropic.claude-3-5-haiku-20241022-v1:0",
    input={
        "converse": input_to_count
    }
)

print(response["inputTokens"])
```

# Amazon Bedrock クォータの引き上げをリクエストする
<a name="quotas-increase"></a>

アカウントのクォータ引き上げをリクエストする手順は、「[Amazon Bedrock サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)」のクォータ表に記載の**引き上げ可能**列の値によって異なります。
+ **はい**とマークされているクォータは、「Service Quotas ユーザーガイド」の「[クォータ引き上げのリクエスト](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)」の手順に従って調整できます。
+ いずれのモデルでも、以下のクォータをまとめて引き上げをリクエストできます。
  + *\$1\$1model\$1* のクロスリージョン InvokeModel トークン数/分
  + *\$1\$1model\$1* の 1 分あたりのクロスリージョン InvokeModel のリクエスト数
  + *\$1\$1model\$1* の 1 分あたりのオンデマンド InvokeModel のトークン数
  + *\$1\$1model\$1* のオンデマンド InvokeModel リクエスト数/分
  + *\$1\$1model\$1* の 1 日あたりのモデル呼び出しの最大トークン数

  これらのクォータの任意の組み合わせの引き上げをリクエストするには、「Service Quotas ユーザーガイド」の「[クォータ引き上げのリクエスト](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html)」の手順に従って、*\$1\$1model\$1* の**クロスリージョン InvokeModel トークン数/分**のクォータの引き上げをリクエストします。リクエスト送信後、サポートチームから連絡があり、他の 4 つのクォータも引き上げるオプションをご案内します。
**注記**  
圧倒的な需要により、既存のクォータ割り当てを消費するトラフィックを生成するお客様に優先権が与えられます。この条件を満たしていない場合、リクエストは拒否されることがあります。

# モデル推論を高速化するためのプロンプトキャッシュ
<a name="prompt-caching"></a>

プロンプトキャッシュは、Amazon Bedrock でサポートされているモデルで使用できるオプション機能であり、推論レスポンスのレイテンシーと入力トークンのコストを削減できます。コンテキストの一部をキャッシュに追加することで、モデルはキャッシュを活用して入力の再計算をスキップできるため、Bedrock はコンピューティングの節約を共有し、レスポンスのレイテンシーを短縮できます。

プロンプトキャッシュは、長さと繰り返しがあり複数のクエリで頻繁に再利用されるコンテキストのワークロードがある場合に役立ちます。例えば、ユーザーがドキュメントをアップロードして質問できるチャットボットがある場合、ユーザーが入力するたびにモデルがドキュメントを処理すると時間がかかる可能性があります。プロンプトキャッシュを使用すると、ドキュメントをキャッシュでき、そのドキュメントを含む将来のクエリを再処理する必要がなくなります。

プロンプトキャッシュを使用する場合、キャッシュから読み取られたトークンに対して割引料金で課金されます。モデルによっては、キャッシュに書き込まれたトークンは、キャッシュされていない入力トークンよりも高い料金で課金される場合があります。キャッシュとの間で読み書きされないトークンは、そのモデルの標準入力トークン料金で課金されます。詳細については、「[Amazon Bedrock の料金ページ](https://aws.amazon.com/bedrock/pricing/)」を参照してください。

## 仕組み
<a name="prompt-caching-overview"></a>

プロンプトキャッシュを使用する場合、Amazon Bedrock は*キャッシュチェックポイント*で構成されるキャッシュを作成します。これらは、キャッシュするプロンプトの連続するサブセクションを定義するマーカーです (多くの場合、プロンプトプレフィックスと呼ばれます)。これらのプロンプトプレフィックスはリクエスト間で静的である必要があり、後続のリクエストでプロンプトプレフィックスを変更すると、キャッシュミスが発生します。

キャッシュチェックポイントには、使用している特定のモデルに応じて、トークンの最小数と最大数があります。キャッシュチェックポイントは、合計プロンプトプレフィックスがトークンの最小数を満たしている場合にのみ作成できます。例えば、Anthropic Claude 3.7 Sonnet モデルでは、キャッシュチェックポイントあたり少なくとも 1,024 トークンが必要です。つまり、最初のキャッシュチェックポイントは 1,024 トークンの後に定義でき、2 番目のキャッシュチェックポイントは 2,048 トークンの後に定義できます。トークンの最小数を満たす前にキャッシュチェックポイントを追加しようとすると、推論は成功しますが、プレフィックスはキャッシュされません。キャッシュには有効期限 (TTL) があり、キャッシュヒットが成功するたびにリセットされます。この期間中、キャッシュ内のコンテキストは保持されます。TTL ウィンドウ内でキャッシュヒットが発生しない場合、キャッシュは期限切れになります。ほとんどのモデルは 5 分間の TTL をサポートし、Claude Opus4.5、Claude Haiku 4.5、および は 1 時間の延長 TTL オプションClaude Sonnet 4.5もサポートしています。

プロンプトキャッシュは、サポートされているモデルの Amazon Bedrock でモデル推論を取得するたびに使用できます。プロンプトキャッシュは、次の Amazon Bedrock 機能でサポートされています。

**Converse API と ConverseStream API**  
プロンプトでキャッシュチェックポイントを指定して、モデルと会話を続けることができます。

**InvokeModel API と InvokeModelWithResponseStream API**  
プロンプトキャッシュを有効にしてキャッシュチェックポイントを指定する、単一のプロンプトリクエストを送信できます。

**クロスリージョン推論を使用したプロンプトキャッシュ**  
プロンプトキャッシュは、クロスリージョン推論と組み合わせて使用できます。クロスリージョン推論は、推論リクエストを処理するために地域内の最適な AWS リージョンを自動的に選択し、利用可能なリソースとモデルの可用性を最大化します。需要が高い場合、この最適化によりキャッシュ書き込みが増加する可能性があります。

**Amazon Bedrock Prompt Management**  
プロンプト[を作成](prompt-management-create.md)または[変更](prompt-management-modify.md)するときに、プロンプトキャッシュを有効にするように選択できます。モデルに応じて、システムプロンプト、システム手順、メッセージ (ユーザーとアシスタント) をキャッシュできます。プロンプトキャッシュは無効にすることもできます。

API を使用すると、プロンプトキャッシュを最も柔軟かつきめ細かく制御できます。プロンプト内で個々のキャッシュチェックポイントを設定できます。特定のモデルで許可されているキャッシュチェックポイントの最大数までキャッシュチェックポイントをさらに作成することで、キャッシュを追加できます。詳細については、「[サポートされているモデル、リージョン、制限](#prompt-caching-models)」を参照してください。

## サポートされているモデル、リージョン、制限
<a name="prompt-caching-models"></a>

次の表は、サポートされているモデルとそのトークンの最小値、キャッシュチェックポイントの最大数、キャッシュチェックポイントを許可するフィールドの一覧です。


| モデル名 | モデル ID | リリースタイプ | キャッシュチェックポイントあたりのトークンの最小数 | リクエストあたりのキャッシュチェックポイントの最大数 | サポートされている TTL | プロンプトキャッシュチェックポイントを受け入れるフィールド | 
| --- | --- | --- | --- | --- | --- | --- | 
| Claude Opus 4.5 | anthropic.claude-opus-4-5-20251101-v1:0 | 一般提供 | 4,096 | 4 | 5 分、1 時間 | 「system」、「messages」、「tools」 | 
| Claude Opus 4.1 | anthropic.claude-opus-4-1-20250805-v1:0 | 一般提供 | 1,024 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Claude Opus 4 | anthropic.claude-opus-4-20250514-v1:0 | 一般提供 | 1,024 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Claude Sonnet 4.5 | anthropic.claude-sonnet-4-5-20250929-v1:0 | 一般提供 | 1,024 | 4 | 5 分、1 時間 | 「system」、「messages」、「tools」 | 
| Claude Haiku 4.5 | anthropic.claude-haiku-4-5-20251001-v1:0 | 一般提供 | 4,096 | 4 | 5 分、1 時間 | 「system」、「messages」、「tools」 | 
| Claude Sonnet 4 | anthropic.claude-sonnet-4-20250514-v1:0 | 一般提供 | 1,024 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Claude 3.7 Sonnet | anthropic.claude-3-7-sonnet-20250219-v1:0 | 一般提供 | 1,024 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Claude 3.5 Haiku | anthropic.claude-3-5-haiku-20241022-v1:0 | 一般提供 | 2,048 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 | プレビュー | 1,024 | 4 | 5 分 | 「system」、「messages」、「tools」 | 
| Amazon Nova Micro | amazon.nova-micro-v1:0 | 一般提供 | 1K1 | 4 | 5 分 | 「system」と「messages」 | 
| Amazon Nova Lite | amazon.nova-lite-v1:0 | 一般提供 | 1K1 | 4 | 5 分 | 「system」と「messages」2 | 
| Amazon Nova Pro | amazon.nova-pro-v1:0 | 一般提供 | 1K1 | 4 | 5 分 | 「system」と「messages」2 | 
| Amazon Nova Premier | amazon.nova-premier-v1:0 | 一般提供 | 1K1 | 4 | 5 分 | 「system」と「messages」2 | 
| Amazon Nova 2 Lite | amazon.nova-2-lite-v1:0 | 一般提供 | 1K1 | 4 | 5 分 | 「system」と「messages」2 | 

1: Amazon Nova モデルは、プロンプトキャッシュ用に最大 20,000 トークンをサポートします。

2: プロンプトキャッシュは主にテキストプロンプト用です。

サポートされているモデル (Claude Opus 4.5、、および Claude Sonnet 4.5) で 1 時間の TTL オプションを使用するにはClaude Haiku 4.5、キャッシュチェックポイントで `ttl`フィールドを指定します。Converse API で、 `cachePoint` オブジェクト`"ttl": "1h"`に を追加します。Claude モデル用の InvokeModel API で、 `cache_control` オブジェクト`"ttl": "1h"`に を追加します。`ttl` 値を指定しない場合、デフォルトの 5 分間のキャッシュ動作が適用されます。1 時間の TTL は、長時間実行されるセッションやバッチ処理シナリオで、長期間キャッシュを維持する場合に便利です。

Amazon Nova は、`User` および `System` メッセージを含むすべてのテキストプロンプトの自動プロンプトキャッシュを提供します。このメカニズムにより、明示的な設定がない場合でも、プロンプトが反復的な部分で始まる場合にレイテンシーのメリットを得られます。ただし、コスト削減を実現し、より一貫したパフォーマンス上のメリットを確保するには、**明示的なプロンプトキャッシュ**にオプトインすることをお勧めします。

## Claude モデルのキャッシュ管理の簡素化
<a name="prompt-caching-simplified"></a>

Claude モデルの場合、Amazon Bedrock はキャッシュ管理のアプローチを簡素化し、キャッシュチェックポイントを手動で配置する複雑さを軽減します。正確なキャッシュチェックポイントの場所を指定する代わりに、静的コンテンツの最後にある 1 つのブレークポイントで自動キャッシュ管理を使用できます。

キャッシュ管理の簡素化を有効にすると、指定されたブレークポイントから最大約 20 個のコンテンツブロックまで遡って、以前のコンテンツブロック境界でのキャッシュヒットが自動的にチェックされます。これにより、モデルは最適なチェックポイントの場所を予測することなく、最も長く一致するプレフィックスをキャッシュから見つけることができます。これを使用するには、動的または可変コンテンツの前の、静的コンテンツの最後に 1 つのキャッシュチェックポイントを配置します。システムは最適なキャッシュ一致を自動的に見つけます。

よりきめ細かな制御を行うには、複数のキャッシュチェックポイント (Claude モデルの場合は最大 4 つ) を使用して正確なキャッシュ境界を指定することもできます。異なる頻度で変化するセクションをキャッシュする場合や、キャッシュされる内容を正確に制御したい場合は、複数のキャッシュチェックポイントを使用する必要があります。

**重要**  
自動プレフィックスチェックは、キャッシュチェックポイントから約 20 個のコンテンツブロックのみを遡って調べます。静的コンテンツがこの範囲を超える場合は、複数のキャッシュチェックポイントを使用するか、プロンプトを再構築して、最も頻繁に再利用されるコンテンツをこの範囲内に配置することを検討してください。

## プロンプトキャッシュを効果的に使用する方法
<a name="prompt-caching-effective-use"></a>

定期的に使用されるプロンプト (5 分ごとにより頻繁に使用されるシステムプロンプト) がある場合は、引き続き 5 分間のキャッシュを使用します。これは追加料金なしで更新されるためです。

1 時間のキャッシュは、以下のシナリオに最適です。
+ 使用する頻度が 5 分未満で、1 時間ごとよりも頻繁になる可能性があるプロンプトがある場合。例えば、エージェント側のエージェントが 5 分以上かかる場合、またはユーザーとの長いチャット会話を保存する場合、通常、そのユーザーは今後 5 分間応答しない可能性があります。
+ レイテンシーが重要で、フォローアッププロンプトが 5 分を超えて送信される場合があります。
+ レート制限の使用率を向上させる場合、キャッシュヒットはレート制限に対して差し引かれないためです。

同じリクエストで 1 時間および 5 分のキャッシュコントロールの両方を使用できますが、重要な制約があります。TTL が長いキャッシュエントリは、短い TTLs の前に表示する必要があります (つまり、5 分のキャッシュエントリの前に 1 時間のキャッシュエントリを表示する必要があります）。

## 開始方法
<a name="prompt-caching-get-started"></a>

以下のセクションでは、Amazon Bedrock を介してモデルを操作する各方法でプロンプトキャッシュ機能を使用する方法の概要を示します。

### Converse API
<a name="prompt-caching-converse"></a>

[Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) API には、複数ターンの会話でプロンプトキャッシュを実装するための高度で柔軟なオプションが用意されています。各モデルのプロンプト要件の詳細については、前のセクションの「[サポートされているモデル、リージョン、制限](#prompt-caching-models)」を参照してください。

**リクエストの例**

次の例は、Converse API へのリクエストの `messages`、`system`、または `tools` フィールドに設定されたキャッシュチェックポイントを示しています。特定のリクエストで、これらの場所のいずれかにチェックポイントを配置できます。例えば、Claude 3.5 Sonnet v2 モデルにリクエストを送信する場合、2 つのキャッシュチェックポイントを `messages` に、1 つのキャッシュチェックポイントを `system` に、もう 1 つのキャッシュチェックポイントを `tools` に配置することができます。Converse API リクエストの構造化と送信の詳細な例については、「[Converse API オペレーションを使用して会話を実行する](conversation-inference.md)」を参照してください。

次のように目的の ttl 値を指定します。ttl 値が指定されていない場合、デフォルトの動作である 5 分間のキャッシュが適用されます。

```
"cachePoint" : {
    "type": "default",
    "ttl" : "5m | 1h"
}
```

------
#### [ messages checkpoints ]

この例では、最初の `image` フィールドはモデルにイメージを提供し、2 番目の `text` フィールドはモデルに画像の分析を求めます。`content` オブジェクトの `cachePoint` の前にあるトークンの数がモデルの最小トークン数を満たす限り、キャッシュチェックポイントが作成されます。

```
...
"messages": [
   {
        "role": "user",
        "content": [
            {
                "image": {
                    "bytes": "asfb14tscve..."
                }
            },
            {
                "text": "What's in this image?"
            },
            {
                "cachePoint": {
                    "type": "default"
                }
            }
      ]
  }
]
...
```

------
#### [ system checkpoints ]

この例では、`text` フィールドにシステムプロンプトを指定します。さらに、システムプロンプトをキャッシュする `cachePoint` フィールドを追加できます。

```
...
  "system": [ 
    {
        "text": "You are an app that creates play lists for a radio station that plays rock and pop music. Only return song names and the artist. "
    },
    {
        "cachePoint": {
            "type": "default"
        }
    }
  ],
...
```

------
#### [ tools checkpoints ]

この例では、`toolSpec` フィールドにツール定義を指定します。(または、以前に定義したツールを呼び出すこともできます。詳細については、「[ツールを使用して Amazon Bedrock のモデルレスポンスを完成させる](tool-use.md)」を参照してください)。その後、ツールをキャッシュする `cachePoint` フィールドを追加できます。

```
...
toolConfig={
    "tools": [
        {
            "toolSpec": {
                "name": "top_song",
                "description": "Get the most popular song played on a radio station.",
                "inputSchema": {
                    "json": {
                        "type": "object",
                        "properties": {
                            "sign": {
                                "type": "string",
                                "description": "The call sign for the radio station for which you want the most popular song. Example calls signs are WZPZ and WKRP."
                            }
                        },
                        "required": [
                            "sign"
                        ]
                    }
                }
            }
        },
        {
                "cachePoint": {
                    "type": "default"
                }
        }
    ]
}
...
```

------

Converse API からのモデルレスポンスには、プロンプトキャッシュに固有の 3 つの新しいフィールドが含まれています。`CacheReadInputTokens` と `CacheWriteInputTokens` の値は、キャッシュから読み取られたトークンの数と、以前のリクエストのためにキャッシュに書き込まれたトークンの数を示します。`CacheDetails` 値は、キャッシュに書き込まれたトークンの数に使用される ttl を示します。これらは、Amazon Bedrock によって課金される値で、完全なモデル推論のコストよりも低い料金です。

### InvokeModel API
<a name="prompt-caching-invoke"></a>

[InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) API を呼び出すと、プロンプトキャッシュはデフォルトで有効になります。前の Converse API の例と同様に、キャッシュチェックポイントはリクエスト本文の任意の時点で設定できます。

------
#### [ Anthropic Claude ]

次の例は、Anthropic Claude 3.5 Sonnet v2 モデルの InvokeModel リクエストの本文を構成する方法を示しています。InvokeModel リクエストの本文の正確な形式とフィールドは、選択したモデルによって異なる場合があります。さまざまなモデルのリクエスト本文とレスポンス本文の形式と内容を確認するには、「[Inference request parameters and response fields for foundation models](model-parameters.md)」を参照してください。

次のように目的の ttl 値を指定します。ttl 値が指定されていない場合、デフォルトの動作である 5 分間のキャッシュが適用されます。

```
"cache_control" : {
    "type": "ephemeral",
    "ttl" : "5m | 1h"
}
```

```
body={
        "anthropic_version": "bedrock-2023-05-31",
        "system":"Reply concisely",
        "messages": [
            {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Describe the best way to learn programming."
                },
                {
                    "type": "text",
                    "text": "Add additional context here for the prompt that meets the minimum token requirement for your chosen model.",
                    "cache_control": {
                        "type": "ephemeral"
                    }
                }
            ]
            }
        ],
        "max_tokens": 2048,
        "temperature": 0.5,
        "top_p": 0.8,
        "stop_sequences": [
            "stop"
        ],
        "top_k": 250
}
```

------
#### [ Amazon Nova ]

次の例は、Amazon Nova モデルの InvokeModel リクエストの本文を構成する方法を示しています。InvokeModel リクエストの本文の正確な形式とフィールドは、選択したモデルによって異なる場合があります。さまざまなモデルのリクエスト本文とレスポンス本文の形式と内容を確認するには、「[Inference request parameters and response fields for foundation models](model-parameters.md)」を参照してください。

```
{
    "system": [{
        "text": "Reply Concisely"
    }],
    "messages": [{
        "role": "user",
        "content": [{
            "text": "Describe the best way to learn programming"
        },
        {
            "text": "Add additional context here for the prompt that meets the minimum token requirement for your chosen model.",
            "cachePoint": {
                "type": "default"
            }
        }]
    }],
    "inferenceConfig": {
        "maxTokens": 300,
        "topP": 0.1,
        "topK": 20,
        "temperature": 0.3
    }
}
```

------

InvokeModel リクエストの送信の詳細については、「[InvokeModel で 1 つのプロンプトを送信する](inference-invoke.md)」を参照してください。

### プレイグラウンド
<a name="prompt-caching-playground"></a>

Amazon Bedrock コンソールのチャットプレイグラウンドで、プロンプトキャッシュオプションを有効にすると、Amazon Bedrock が自動的にキャッシュチェックポイントを作成します。

Amazon Bedrock プレイグラウンドでプロンプトを開始するには、「[Generate responses in the console using playgrounds](playgrounds.md)」の手順に従います。サポートされているモデルでは、プレイグラウンドでプロンプトキャッシュが自動的に有効になります。そうでない場合は、次の手順を実行してプロンプトキャッシュを有効にします。

1. 左側のパネルで、**[設定]** メニューを開きます。

1. **[プロンプトキャッシュ]** の切り替えをオンにします。

1. プロンプトを実行します。

入力レスポンスとモデルレスポンスの組み合わせがチェックポイントに必要なトークンの最小数 (モデルによって異なります) に達すると、Amazon Bedrock は最初のキャッシュチェックポイントを自動的に作成します。チャットを続けると、トークンの最小数に達するたびに、モデルで許可されるチェックポイントの最大数まで新しいチェックポイントが作成されます。次のスクリーンショットに示すように、**[プロンプトキャッシュ]** の切り替えの横にある **[キャッシュチェックポイントを表示する]** を選択すると、キャッシュチェックポイントをいつでも表示できます。

![\[Amazon Bedrock テキストプレイグラウンドでのプロンプトキャッシュの UI トグル\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/images/prompt-caching/bedrock-prompt-caching-ui-toggle.png)


プレイグラウンドレスポンスで **[キャッシュメトリクス]** ポップアップ (![\[The metrics icon shown in model responses when prompt caching is enabled.\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/images/prompt-caching/bedrock-prompt-caching-metrics-icon.png)) を表示して、モデルとのやり取りによってキャッシュとの間で読み書きされているトークンの数を表示できます。

![\[キャッシュとの間で読み書きされたトークンの数を示すキャッシュメトリクスボックス\]](http://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/images/prompt-caching/bedrock-prompt-caching-metrics.png)


会話の途中でプロンプトキャッシュの切り替えをオフにすると、モデルとのチャットを続行できます。