在模型調用中使用推論描述檔 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在模型調用中使用推論描述檔

您可以使用跨區域推論描述檔來取代基礎模型,將請求路由到多個區域。若要追蹤模型的成本和用量,您可以在一或多個區域中使用應用程式推論設定檔。若要了解如何在執行模型推論時使用推論描述檔,請選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console

在 主控台中,您可以使用的唯一推論設定檔是美國東部 (維吉尼亞北部) 區域中的美國AnthropicClaude 3 Opus推論設定檔。

若要使用此推論設定檔,請切換到美國東部 (維吉尼亞北部) 區域。當您達到選取AnthropicClaude 3 Opus模型的步驟時,請執行下列其中一項操作,並選取模型和跨區域推論做為輸送量

API

從包含於下列 API 操作的任何區域執行推論時,您可以使用推論描述檔:

注意

如果您使用的是跨區域 (系統定義) 推論描述檔,則可以使用 ARN 或推論描述檔的 ID。