View a markdown version of this page

アプリケーション推論プロファイル - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アプリケーション推論プロファイル

アプリケーション推論プロファイル (AIPs) を使用すると、bedrock-runtimeエンドポイント上の Amazon Bedrock InvokeModel API と Converse APIs の Amazon Bedrock コストをアプリケーション、チーム、またはワークロード別に属性付けできます。各 AIP はモデル固有であり、 AWS Cost Explorer とコストと使用状況レポート (CUR 2.0) に流れる AWS コスト配分タグが付けられます。

bedrock-mantle エンドポイントでレスポンスとチャット完了を使用するワークロードの場合は、プロジェクト代わりに を使用します。

コスト属性の仕組み

アプリケーション推論プロファイルは、特定の Amazon Bedrock モデルを参照するリソースです。プロファイルを作成し、コスト配分タグをアタッチしてから、API コールでモデル ID の代わりにプロファイル ARN を使用します。プロファイルのタグは、各リクエストの請求レコードにアタッチされます。

次の例は、Converse API を呼び出すときにモデル ID の代わりにアプリケーション推論プロファイル ARN を使用する方法を示しています。

import boto3 client = boto3.client("bedrock-runtime") response = client.converse( modelId="arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-team-profile", messages=[ {"role": "user", "content": [{"text": "Hello"}]} ] )

プロファイルの作成の詳細については、「」を参照してくださいアプリケーション推論プロファイルを作成する

プロファイルコストの表示

プロファイルを作成してタグ付けしたら、 AWS 請求情報とコスト管理コンソールでコスト配分タグとしてタグをアクティブ化します。

  1. Billing AWS and Cost Management コンソールを開きます。

  2. ナビゲーションペインで、[Cost Allocation Tags] (コスト配分タグ) を選択します。

  3. プロファイルに適用したタグを選択します。

  4. [アクティブ化] を選択します。

タグは、アクティベーション後に Cost Explorer と CUR に表示されるまでに最大 24 時間かかる場合があります。コスト配分タグは遡及的ではありません。アクティベーション後に発生したコストのみがタグ付けされます。詳細については、「ユーザー定義のコスト配分タグのアクティブ化」を参照してください。

タグのアクティベーション後、以下のツールでアプリケーション推論プロファイル別に Amazon Bedrock のコストを分析できます。

  • AWS Cost Explorer – プロファイルタグでフィルタリングして、時間の経過に伴うコスト傾向を表示します。タグ別にグループ化して、プロファイル間でコストを比較します。

  • AWS コストと使用状況レポート (CUR 2.0) – プロファイルタグ別に明細項目のコスト内訳の CUR データをクエリします。

スケーリングに関する考慮事項

各アプリケーション推論プロファイルは、特定のモデルに関連付けられます。つまり、モデル、チーム、タグセットの一意の組み合わせごとに個別のプロファイルが必要です。組織が成長するにつれて、特に新しいモデルバージョンで新しいプロファイルが必要な場合、プロファイル数は急速に増加する可能性があります。

プロファイルの拡散を減らすには:

  • 推奨: コスト追跡の柔軟性と使いやすさプロジェクトのために を使用します。

  • ユーザーごとではなく、チームレベルまたはコストセンターレベルでタグ付けします。

  • 追加のプロファイルを作成せずにユーザーごとのコスト属性を指定するには、 を使用しますIAM プリンシパル属性。IAM プリンシパル追跡は、アプリケーション推論プロファイルと属性のコストとともに ID レベルで自動的に機能します。