翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
クロスリージョン推論によりスループットを向上させる
クロスリージョン推論では、特定の地域 (米国や欧州など) に関連付けられたクロスリージョン推論プロファイルを選択するか、グローバル推論プロファイルを選択できます。特定の地域に関連付けられた推論プロファイルを選択すると、Amazon Bedrock は推論リクエストを処理するために、その地域AWS リージョン内の最適なコマーシャルを自動的に選択します。グローバル推論プロファイルを使用すると、Amazon Bedrock はリクエストを処理するために最適な商用 AWS リージョンを自動的に選択し、利用可能なリソースを最適化してモデルのスループットを向上させます。
どちらのタイプのクロスリージョン推論も、基盤モデル (FM) とリクエストをAWS リージョンルーティングできる を定義する推論プロファイルを使用します。オンデマンドモードでモデル推論を実行する際、リクエストはサービスクォータまたはピーク使用時間によって制限される場合があります。クロスリージョン推論を使用すると、さまざまな でコンピューティングを利用することで、予期しないトラフィックバーストをシームレスに管理できますAWS リージョン。
プロビジョンドスループットを購入することで、モデルのスループットを向上させることもできます。推論プロファイルは現在、プロビジョンドスループットをサポートしていません。
推論プロファイルを使用してクロスリージョン推論を実行できるリージョンとモデルを確認するには、「推論プロファイルでサポートされているリージョンおよびモデル」を参照してください。
地理的クロスリージョン推論とグローバルクロスリージョン推論の選択
Amazon Bedrock には 2 種類のクロスリージョン推論プロファイルがあり、それぞれが異なるユースケースとコンプライアンス要件に合わせて設計されています。
| 機能 | 地理的クロスリージョン推論 | グローバルクロスリージョン推論 | 推奨事項 |
|---|---|---|---|
| データレジデンシー | 地理的境界内 (米国、欧州、APAC など) | サポートされている世界中のAWS商用リージョン | コンプライアンス要件に地理的を選択する |
| スループット | 単一リージョンよりも高い | 利用可能な最大値 | 最大限のパフォーマンスを得るには Global を選択します。 |
| Cost | 標準料金 | 約 10% の節約 | コスト最適化のためにグローバルを選択する |
| SCP の要件 | プロファイル内のすべての送信先リージョンを許可する | 許可 "aws:RequestedRegion": "unspecified" |
組織のポリシーに基づいて を設定する |
| 以下に最適: | データレジデンシー規制のある組織 | コストとパフォーマンスを優先する組織 | コンプライアンスとパフォーマンスのニーズを評価する |
データレジデンシー要件があり、データ処理が特定の地理的境界内に留まるようにする必要がある場合は、地理的クロスリージョン推論を選択します。地理的制限なしで最大のスループットとコスト削減が必要な場合は、グローバルクロスリージョン推論を選択します。
一般的な考慮事項
クロスリージョン推論に関する以下の情報に注意してください。
-
クロスリージョン推論を使用する場合、追加のルーティングコストは必要ありません。料金は、推論プロファイルを呼び出すリージョンに基づいて計算されます。料金に関する詳細については、「Amazon Bedrock の料金
」を参照してください。 -
クロスリージョン推論は、 で手動で有効にされていないリクエストAWS リージョンを にルーティングできますAWS アカウント。クロスリージョン推論を機能させるには、リージョンを手動で有効にする必要はありません。
-
クロスリージョンオペレーション中に送信されるすべてのデータはネットワーク上にAWS残り、パブリックインターネットを経由しません。データは 間で転送中に暗号化されますAWS リージョン。
-
クロスリージョン推論リクエストはすべて、ソースリージョンの CloudTrail に記録されます。
additionalEventData.inferenceRegionフィールドを探して、リクエストが処理された場所を特定します。 -
AWSAmazon Bedrock が提供するサービスも CRIS を使用する場合があります。詳細については、サービス固有のドキュメントを参照してください。