本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在模型調用中使用推論設定檔
<a name="inference-profiles-use"></a>

您可以使用跨區域推論設定檔來取代基礎模型，將請求路由到多個區域。若要追蹤模型的成本和用量，您可以在一或多個區域中使用應用程式推論設定檔。若要了解如何在執行模型推論時使用推論設定檔，請選擇您偏好方法的索引標籤，然後遵循下列步驟：

------
#### [ Console ]

若要搭配支援推論設定檔的功能使用推論設定檔，請執行下列動作：

1. 使用具有 Amazon Bedrock 主控台使用許可的 IAM 身分登入AWS 管理主控台。接著，開啟位於 [https://console.aws.amazon.com/bedrock](https://console.aws.amazon.com/bedrock) 的 Amazon Bedrock 主控台。

1. 導覽至您要使用推論設定檔的功能頁面。例如，從左側導覽窗格中選取**聊天/文字遊樂場**。

1. 選擇**選取模型**，然後選擇模型。例如，選擇 **Amazon**，然後選擇 **Nova Premier**。

1. 在**推論**下，從下拉式功能表中選取**推論設定檔**。

1. 選取要使用的推論設定檔 (例如，**US Nova Premier**)，然後選擇**套用**。

------
#### [ API ]

從包含於下列 API 操作的任何區域執行推論時，您可以使用推論設定檔：
+ [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) 或 [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) – 若要在模型調用中使用推論設定檔，請遵循 [使用 InvokeModel 提交單一提示](inference-invoke.md) 中的步驟，並在 `modelId` 欄位中指定推論設定檔的 Amazon Resource Name (ARN)。如需範例，請參閱[在模型調用中使用推論設定檔](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html#API_runtime_InvokeModel_Example_5)。
+ [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) 或 [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) – 若要搭配 Converse API 在模型調用中使用推論設定檔，請遵循 [與 Converse API 操作進行對話](conversation-inference.md) 中的步驟，並在 `modelId` 欄位中指定推論設定檔的 ARN。如需範例，請參閱[在對話中使用推論設定檔](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html#API_runtime_Converse_Example_5)。
+ [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html) – 若要在從查詢知識庫的結果產生回應時使用推論設定檔，請遵循 [使用查詢和回應測試您的知識庫](knowledge-base-test.md) 中 API 索引標籤中的步驟，並在 `modelArn` 欄位中指定推論設定檔的 ARN。如需詳細資訊，請參閱[使用推論設定檔來產生回應](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent-runtime_RetrieveAndGenerate.html#API_agent-runtime_RetrieveAndGenerate_Example_3)。
+ [CreateEvaluationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateEvaluationJob.html) – 若要提交用於模型評估的推論設定檔，請遵循 [在 Amazon Bedrock 中啟動自動模型評估任務](model-evaluation-jobs-management-create.md) 中 API 索引標籤中的步驟，並在 `modelIdentifier` 欄位中指定推論設定檔的 ARN。
+ [CreatePrompt](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreatePrompt.html) – 若要在為提示管理中建立的提示產生回應時使用推論設定檔，請遵循 [使用提示管理建立提示](prompt-management-create.md) 中 API 索引標籤中的步驟，並在 `modelId` 欄位中指定推論設定檔的 ARN。
+ [CreateFlow](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateFlow.html) – 若要在為流程中提示節點內定義的內嵌提示產生回應時使用推論設定檔，請遵循 [在 Amazon Bedrock 中建立和設計流程](flows-create.md) 中 API 索引標籤中的步驟。在定義[提示節點](flows-nodes.md#flows-nodes-prompt)時，請在 `modelId` 欄位中指定推論設定檔的 ARN。
+ [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html) – 若要在剖析資料來源中的非文字資訊時使用推論設定檔，請遵循 [剖析資料來源的選項](kb-advanced-parsing.md) 中 API 區段中的步驟，並在 `modelArn` 欄位中指定推論設定檔的 ARN。

**注意**  
如果您使用的是跨區域 (系統定義) 推論設定檔，則可以使用 ARN 或推論設定檔的 ID。

------