本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
應用程式推論設定檔
應用程式推論設定檔 (AIPs) 可讓您根據應用程式、團隊或工作負載,將 Amazon Bedrock 成本歸因於bedrock-runtime端點上的 Amazon Bedrock InvokeModel 和 Converse APIs。每個 AIP 都是模型特定的,並帶有成本分配標籤,這些標籤會流向 AWS Cost Explorer 和 AWS 成本和用量報告 (CUR 2.0)。
對於在bedrock-mantle端點上使用回應和聊天完成的工作負載,請專案改用 。
成本歸因的運作方式
應用程式推論設定檔是參考特定 Amazon Bedrock 模型的資源。您可以建立設定檔、連接成本分配標籤,然後在 API 呼叫中使用設定檔 ARN 取代模型 ID。設定檔的標籤會連接到每個請求的帳單記錄。
下列範例示範如何在呼叫 Converse API 時使用應用程式推論設定檔 ARN,而非模型 ID:
import boto3 client = boto3.client("bedrock-runtime") response = client.converse( modelId="arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-team-profile", messages=[ {"role": "user", "content": [{"text": "Hello"}]} ] )
如需建立設定檔的詳細資訊,請參閱 建立應用程式推論設定檔。
檢視設定檔成本
建立和標記設定檔後,在 AWS Billing and Cost Management 主控台中將標籤啟用為成本分配標籤:
-
開啟 AWS Billing and Cost Management 主控台。
-
在導覽窗格中,選擇 Cost allocation tags (成本分配標籤)。
-
選取您套用至設定檔的標籤。
-
選擇 Activate (啟用)。
啟用後,標籤最多可能需要 24 小時才會出現在 Cost Explorer 和 CUR 中。成本分配標籤不追溯。只有啟用後產生的成本才會加上標籤。如需詳細資訊,請參閱啟用使用者定義的成本分配標籤。
啟用標籤後,您可以透過下列工具中的應用程式推論設定檔來分析 Amazon Bedrock 成本:
-
AWS Cost Explorer – 依設定檔標籤篩選,以檢視隨時間變化的成本趨勢。依標籤分組,以比較跨設定檔的成本。
-
AWS 成本和用量報告 (CUR 2.0) – 依設定檔標籤查詢明細項目成本明細的 CUR 資料。
擴展考量
每個應用程式推論設定檔都與特定模型繫結。這表示您需要針對模型、團隊和標籤集的每個唯一組合個別的設定檔。隨著組織的成長,設定檔計數可能會快速增加,尤其是當新的模型版本需要新的設定檔時。
若要減少設定檔擴散: