本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在模型調用中使用推論描述檔
您可以使用跨區域推論設定檔來取代基礎模型,將請求路由到多個區域。若要追蹤模型的成本和用量,您可以在一或多個區域中使用應用程式推論設定檔。若要了解如何在執行模型推論時使用推論描述檔,請選擇您偏好方法的索引標籤,然後遵循下列步驟:
- Console
-
若要搭配支援推論描述檔的功能使用推論描述檔,請執行下列動作:
-
AWS Management Console 使用具有使用 Amazon Bedrock 主控台之許可的 IAM 主體登入 。然後,開啟位於 https://https://console.aws.amazon.com/bedrock/
的 Amazon Bedrock 主控台。 -
導覽至您要使用推論描述檔的功能頁面。例如,從左側導覽窗格中選取聊天/文字遊樂場。
-
選擇選取模型,然後選擇模型。例如,選擇 Amazon,然後選擇 Nova Premier。
-
在推論下,從下拉式功能表中選取推論設定檔。
-
選取要使用的推論設定檔 (例如,US Nova Premier),然後選擇套用。
-
- API
-
從包含於下列 API 操作的任何區域執行推論時,您可以使用推論描述檔:
-
InvokeModel 或 InvokeModelWithResponseStream – 若要在模型調用中使用推論描述檔,請遵循 中的步驟,使用 InvokeModel 提交單一提示並在
modelId
欄位中指定推論描述檔的 Amazon Resource Name (ARN)。如需範例,請參閱在模型調用中使用推論描述檔。 -
Converse 或 ConverseStream – 若要搭配 Converse API 在模型調用中使用推論描述檔,請遵循 中的步驟,與 Converse API 操作進行對話並在
modelId
欄位中指定推論描述檔的 ARN。如需範例,請參閱在對話中使用推論設定檔。 -
RetrieveAndGenerate – 若要在從查詢知識庫的結果產生回應時使用推論描述檔,請遵循 中的 API 索引標籤中的步驟,使用查詢和回應測試您的知識庫並在
modelArn
欄位中指定推論描述檔的 ARN。如需詳細資訊,請參閱使用推論精靈來產生回應。 -
CreateEvaluationJob – 若要提交用於模型評估的推論描述檔,請遵循 中的 API 索引標籤中的步驟,在 Amazon Bedrock 中啟動自動模型評估任務並在
modelIdentifier
欄位中指定推論描述檔的 ARN。 -
CreatePrompt – 若要在為提示管理中建立的提示產生回應時使用推論描述檔,請遵循 中的 API 索引標籤中的步驟,使用提示管理建立提示並在
modelId
欄位中指定推論描述檔的 ARN。 -
CreateFlow – 若要在為流程中提示節點內定義的內嵌提示產生回應時使用推論描述檔,請遵循 中的 API 索引標籤中的步驟在 Amazon Bedrock 中建立和設計流程。在定義提示節點時,請在
modelId
欄位中指定推論描述檔的 ARN。 -
CreateDataSource – 若要在剖析資料來源中的非文字資訊時使用推論設定檔,請遵循 中的 API 區段中的步驟,資料來源的剖析選項並在
modelArn
欄位中指定推論設定檔的 ARN。
注意
如果您使用的是跨區域 (系統定義) 推論描述檔,您可以使用 ARN 或推論描述檔的 ID。
-