翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデル呼び出しで推論プロファイルを使用する
基盤モデルの代わりにクロスリージョン推論プロファイルを使用して、複数のリージョンにリクエストをルーティングできます。モデルのコストと使用状況を 1 つ以上のリージョンで追跡するには、アプリケーション推論プロファイルを使用します。モデル推論を実行する際に推論プロファイルを使用する方法については、希望する方法のタブを選択し、手順に従ってください。
- Console
-
推論プロファイルをサポートする機能で推論プロファイルを使用するには、次の手順を実行します。
-
Amazon Bedrock コンソールを使用するためのアクセス許可を持つ IAM ID を使用して、AWS マネジメントコンソールにサインインします。Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock
) を開きます。 -
推論プロファイルを使用する機能のページに移動します。例えば、左側のナビゲーションペインで [チャット/テキストのプレイグラウンド] を選択します。
-
[モデルを選択] を選択し、モデルを選択します。例えば、[Amazon]、[Nova Premier] の順に選択します。
-
[推論] で、ドロップダウンメニューから [推論プロファイル] を選択します。
-
使用する推論プロファイル (US Nova Premier など) を選択し、[適用] を選択します。
-
- API
-
推論プロファイルは、次の API オペレーションを使用して、そのプロファイルに含まれる任意のリージョンから推論を実行する際に使用できます。
-
InvokeModel または InvokeModelWithResponseStream – モデル呼び出しで推論プロファイルを使用するには、「InvokeModel で 1 つのプロンプトを送信する」の手順に従って、
modelIdフィールドに推論プロファイルの Amazon リソースネーム (ARN) を指定します。例については、「Use an inference profile in model invocation」を参照してください。 -
Converse または ConverseStream – Converse API を使用したモデル呼び出しで推論プロファイルを使用するには、「Converse API オペレーションを使用して会話を実行する」の手順に従って、
modelIdフィールドに推論プロファイルの ARN を指定します。例については、「Use an inference profile in a conversation」を参照してください。 -
RetrieveAndGenerate – ナレッジベースでのクエリの結果からレスポンスを生成する際に推論プロファイルを使用するには、「クエリとレスポンスを使用してナレッジベースをテストする」の API タブの手順に従って、
modelArnフィールドに推論プロファイルの ARN を指定します。詳細については、「Use an inference proflie to generate a response」を参照してください。 -
CreateEvaluationJob – モデル評価用に推論プロファイルを送信するには、「Amazon Bedrock で自動モデル評価ジョブを開始する」の API タブの手順に従って、
modelIdentifierフィールドに推論プロファイルの ARN を指定します。 -
CreatePrompt – プロンプト管理で作成したプロンプトのレスポンスを生成する際に推論プロファイルを使用するには、「プロンプト管理を使用してプロンプトを作成する」の API タブの手順に従って、
modelIdフィールドに推論プロファイルの ARN を指定します。 -
CreateFlow – フローのプロンプトノード内で定義したインラインプロンプトのレスポンスを生成する際に推論プロファイルを使用するには、「Amazon Bedrock でフローを作成および設計する」の API タブの手順に従います。プロンプトノード の定義時に、
modelIdフィールドに推論プロファイルの ARN を指定します。 -
CreateDataSource – データソースで非テキスト情報を解析する際に推論プロファイルを使用するには、「データソースの解析オプション」の API セクションの手順に従って、
modelArnフィールドに推論プロファイルの ARN を指定します。
注記
クロスリージョン (システム定義) 推論プロファイルを使用している場合は、推論プロファイルの ARN またはID を使用できます。
-