在模型調用中使用推論設定檔

您可以使用跨區域推論設定檔來取代基礎模型，將請求路由到多個區域。若要追蹤模型的成本和用量，您可以在一或多個區域中使用應用程式推論設定檔。若要了解如何在執行模型推論時使用推論設定檔，請選擇您偏好方法的索引標籤，然後遵循下列步驟：

Console

若要搭配支援推論設定檔的功能使用推論設定檔，請執行下列動作：

AWS Management Console 使用具有使用 Amazon Bedrock 主控台之許可的 IAM 身分登入。接著，開啟位於 https://console.aws.amazon.com/bedrock 的 Amazon Bedrock 主控台。
導覽至您要使用推論設定檔的功能頁面。例如，從左側導覽窗格中選取聊天/文字遊樂場。
選擇選取模型，然後選擇模型。例如，選擇 Amazon，然後選擇 Nova Premier。
在推論下，從下拉式功能表中選取推論設定檔。
選取要使用的推論設定檔 (例如，US Nova Premier)，然後選擇套用。

API

從包含於下列 API 操作的任何區域執行推論時，您可以使用推論設定檔：

InvokeModel 或 InvokeModelWithResponseStream – 若要在模型調用中使用推論設定檔，請遵循使用 InvokeModel 提交單一提示中的步驟，並在 modelId 欄位中指定推論設定檔的 Amazon Resource Name (ARN)。如需範例，請參閱在模型調用中使用推論設定檔。
Converse 或 ConverseStream – 若要搭配 Converse API 在模型調用中使用推論設定檔，請遵循使用 Converse API 進行推論中的步驟，並在 modelId 欄位中指定推論設定檔的 ARN。如需範例，請參閱在對話中使用推論設定檔。
RetrieveAndGenerate – 若要在從查詢知識庫的結果產生回應時使用推論設定檔，請遵循使用查詢和回應測試您的知識庫中 API 索引標籤中的步驟，並在 modelArn 欄位中指定推論設定檔的 ARN。如需詳細資訊，請參閱使用推論設定檔來產生回應。
CreateEvaluationJob – 若要提交用於模型評估的推論設定檔，請遵循在 Amazon Bedrock 中啟動自動模型評估任務中 API 索引標籤中的步驟，並在 modelIdentifier 欄位中指定推論設定檔的 ARN。
CreatePrompt – 若要在為提示管理中建立的提示產生回應時使用推論設定檔，請遵循使用提示管理建立提示中 API 索引標籤中的步驟，並在 modelId 欄位中指定推論設定檔的 ARN。
CreateFlow – 若要在為流程中提示節點內定義的內嵌提示產生回應時使用推論設定檔，請遵循在 Amazon Bedrock 中建立和設計流程中 API 索引標籤中的步驟。在定義提示節點時，請在 modelId 欄位中指定推論設定檔的 ARN。
CreateDataSource – 若要在剖析資料來源中的非文字資訊時使用推論設定檔，請遵循剖析資料來源的選項中 API 區段中的步驟，並在 modelArn 欄位中指定推論設定檔的 ARN。

注意

如果您使用的是跨區域 (系統定義) 推論設定檔，則可以使用 ARN 或推論設定檔的 ID。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

檢視推論設定檔的相關資訊

刪除應用程式推論設定檔