翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Apache Spark アップグレードエージェントのクロスリージョン処理
Apache Spark Upgrade Agent は、クロスリージョン推論を使用して自然言語リクエストを処理し、レスポンスを生成します。クロスリージョン推論では、エージェントは自動的に推論リクエストをルーティングしてパフォーマンスを最適化し、利用可能なコンピューティングリソースとモデルの可用性を最大化し、最高のカスタマーエクスペリエンスを提供します。使用されるクロスリージョン推論のタイプは、Apache Spark Upgrade Agent を実行するリージョンによって異なります。ほとんどのリージョンでは、エージェントは推論リクエストを処理するために、地理的な最適なリージョンを選択します。ただし、一部のリージョンでは、エージェントによって行われた推論リクエストは、すべてのグローバル商用 AWS リージョンで利用可能なすべてのコンピューティングリソースに安全にルーティングされます。
クロスリージョン推論
Apache Spark Upgrade エージェントは を利用しており、クロスリージョン推論を使用して異なる AWS リージョンにトラフィックを分散し、大規模言語モデル (LLM) 推論のパフォーマンスと信頼性を向上させます。
クロスリージョン推論は、Spark アプリケーションまたはアップグレードエクスペリエンスのホスト先やデータの保存先は変わりませんが、入力プロンプトと出力結果が推論処理のために異なるリージョンに送信される場合があります。すべてのデータは Amazon の安全なネットワーク経由で暗号化されて送信されます。
クロスリージョン推論の使用には追加料金はかかりません。
クロスリージョン推論でサポートされているリージョン
地理的クロスリージョン推論を使用するリージョン
ほとんどのリージョンでは、クロスリージョン推論リクエストは、Apache Spark Upgrade Agent を実行するのと同じ地域の一部である AWS リージョン内に保持されます。たとえば、米国東部 (バージニア北部) リージョンのエージェントからのリクエストは、米国リージョン内の AWS リージョンにのみルーティングされます。次の表は、リクエストの送信元の地域に応じて、リクエストをルーティングできるリージョンを示しています。
| サポートされている 地域 | 推論リージョン | |
|---|---|---|
| 1 | アメリカ | 米国東部 (バージニア北部) (us-east-1)、米国西部 (オレゴン) (us-west-2)、米国東部 (オハイオ) (us-east-2)、米国西部 (北カリフォルニア) (us-west-2) |
| 2 | 欧州 | 欧州 (フランクフルト) (eu-central-1)、欧州 (アイルランド) (eu-west-1)、欧州 (パリ) (eu-west-3)、欧州 (ストックホルム) (eu-north-1)、欧州 (ロンドン) (eu-west-2) |
| 3 | アジアパシフィック | アジアパシフィック (東京) (ap-northeast-1)、アジアパシフィック (ソウル) (ap-northeast-2)、アジアパシフィック (ムンバイ) (ap-south-1) |
グローバルクロスリージョン推論を使用するリージョン
重要
次の AWS リージョンは、グローバルクロスリージョン推論を使用します。これらのリージョンで Apache Spark アップグレードエージェントを使用すると、パフォーマンスと可用性を最適化するために、推論処理のためにリクエストが他の AWS リージョンにグローバルに送信される場合があります。
-
南米 (サンパウロ) (sa-east-1)
-
アジアパシフィック (シンガポール) (ap-southeast-1)
-
アジアパシフィック (シドニー) (ap-southeast-2)
-
カナダ (中部) (ca-central-1)