アプリケーション推論プロファイルを作成する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アプリケーション推論プロファイルを作成する

単一または複数のリージョンでアプリケーション推論プロファイルを作成して、モデルを呼び出す際に使用率とコストを追跡できます。

  • 単一のリージョンのアプリケーション推論プロファイルを作成するには、基盤モデルを指定します。そのモデルでそのリージョンに対して実行されたリクエストの使用率とコストが追跡されます。

  • 複数のリージョンのアプリケーション推論プロファイルを作成するには、クロスリージョン (システム定義) 推論プロファイルを指定します。推論プロファイルは、選択したクロスリージョン (システム定義) 推論プロファイルで定義されたリージョンにリクエストをルーティングします。推論プロファイルの複数のリージョンに対して実行されたリクエストの使用率とコストが追跡されます。

現時点では、推論プロファイルは Amazon Bedrock API を使用してのみ作成できます。

推論プロファイルを作成するには、Amazon Bedrock コントロールプレーンエンドポイントを使用して、CreateInferenceProfile リクエストを送信します。

以下のフィールドが必要です。

フィールド ユースケース
inferenceProfileName 推論プロファイルの名前の指定に使用。
modelSource コストと使用率を追跡するモデルとリージョンを定義する基盤モデルまたはクロスリージョン (システム定義) 推論プロファイルの指定に使用。

次のフィールドはオプションです。

フィールド ユースケース
説明 推論プロファイルの説明の入力に使用。
タグ 推論プロファイルへのタグのアタッチに使用。詳細については、Amazon Bedrock リソースにタグ付け「」および「コスト配分タグを使用したAWSコストの整理と追跡」を参照してください。
clientRequestToken API リクエストが 1 回だけ完了するようにします。詳細については、「べき等性の確保」を参照してください。

このレスポンスは、他の推論プロファイル関連アクションで使用できる inferenceProfileArn を返します。これは、モデルの呼び出しや Amazon Bedrock リソースでも使用できます。