翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
モデル呼び出しで推論プロファイルを使用する
基盤モデルの代わりにクロスリージョン推論プロファイルを使用して、複数のリージョンにリクエストをルーティングできます。モデルのコストと使用状況を追跡するには、1 つ以上のリージョンで、アプリケーション推論プロファイルを使用できます。モデル推論の実行時に推論プロファイルを使用する方法については、任意の方法のタブを選択し、ステップに従います。
- Console
-
推論プロファイルをサポートする機能を使用するには、次の手順を実行します。
-
Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM プリンシパル AWS Management Console を使用して にサインインします。次に、https://console.aws.amazon.com/bedrock/
で Amazon Bedrock コンソールを開きます。 -
推論プロファイルを使用する機能のページに移動します。たとえば、左側のナビゲーションペインからチャット/テキストプレイグラウンドを選択します。
-
Select model を選択し、モデルを選択します。例えば、Amazon を選択し、次に Nova Premier を選択します。
-
推論で、ドロップダウンメニューから推論プロファイルを選択します。
-
使用する推論プロファイル (US Nova Premier など) を選択し、適用を選択します。
-
- API
-
推論プロファイルは、次の API オペレーションを使用して、そのプロファイルに含まれる任意のリージョンから推論を実行する際に使用できます。
-
InvokeModel または InvokeModelWithResponseStream – モデル呼び出しで推論プロファイルを使用するには、 のステップに従い、
modelId
フィールドに推論プロファイルの Amazon リソースネーム (ARN) InvokeModel で 1 つのプロンプトを送信するを指定します。例については、「Use an inference profile in model invocation」を参照してください。 -
Converse または ConverseStream – Converse API でモデル呼び出しで推論プロファイルを使用するには、「」のステップに従いConverse API オペレーションとの会話を実行する、
modelId
フィールドに推論プロファイルの ARN を指定します。例については、「Use an inference profile in a conversation」を参照してください。 -
RetrieveAndGenerate – ナレッジベースのクエリの結果からレスポンスを生成するときに推論プロファイルを使用するには、 の API タブのステップに従いクエリとレスポンスを使用してナレッジベースをテストする、
modelArn
フィールドに推論プロファイルの ARN を指定します。詳細については、「Use an inference proflie to generate a response」を参照してください。 -
CreateEvaluationJob – モデル評価用に推論プロファイルを送信するには、「Amazon Bedrock で自動モデル評価ジョブを開始する」の API タブの手順に従って、
modelIdentifier
フィールドに推論プロファイルの ARN を指定します。 -
CreatePrompt – プロンプト管理で作成したプロンプトのレスポンスを生成するときに推論プロファイルを使用するには、 の API タブのステップに従い、
modelId
フィールドに推論プロファイルの ARN プロンプト管理を使用してプロンプトを作成するを指定します。 -
CreateFlow – フロー内のプロンプトノード内で定義したインラインプロンプトのレスポンスを生成するときに推論プロファイルを使用するには、 の API タブのステップに従いますAmazon Bedrock でフローを作成して設計する。プロンプトノードを定義するには、
modelId
フィールドに推論プロファイルの ARN を指定します。 -
CreateDataSource – データソース内の非テキスト情報を解析するときに推論プロファイルを使用するには、 の API セクションのステップに従いデータソースの解析オプション、
modelArn
フィールドに推論プロファイルの ARN を指定します。
注記
クロスリージョン (システム定義) 推論プロファイルを使用している場合は、ARN または推論プロファイルの ID を使用できます。
-