在模型調用中使用推論描述檔 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在模型調用中使用推論描述檔

您可以使用跨區域推論設定檔來取代基礎模型,將請求路由到多個區域。若要追蹤模型的成本和用量,您可以在一或多個區域中使用應用程式推論設定檔。若要了解如何在執行模型推論時使用推論描述檔,請選擇您偏好方法的索引標籤,然後遵循下列步驟:

Console

若要搭配支援推論描述檔的功能使用推論描述檔,請執行下列動作:

  1. AWS Management Console 使用具有使用 Amazon Bedrock 主控台之許可的 IAM 主體登入 。然後,開啟位於 https://https://console.aws.amazon.com/bedrock/ 的 Amazon Bedrock 主控台。

  2. 導覽至您要使用推論描述檔的功能頁面。例如,從左側導覽窗格中選取聊天/文字遊樂場

  3. 選擇選取模型,然後選擇模型。例如,選擇 Amazon,然後選擇 Nova Premier

  4. 推論下,從下拉式功能表中選取推論設定檔

  5. 選取要使用的推論設定檔 (例如,US Nova Premier),然後選擇套用

API

從包含於下列 API 操作的任何區域執行推論時,您可以使用推論描述檔:

注意

如果您使用的是跨區域 (系統定義) 推論描述檔,您可以使用 ARN 或推論描述檔的 ID。