Amazon Bedrock 中的推論運作方式 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 中的推論運作方式

當您提交輸入至模型時,模型會預測後續可能的字符序列,並將該序列傳回為輸出。Amazon Bedrock 可讓您使用您選擇的基礎模型執行推論。當您執行推論時,請提供下列輸入:

在不同 AWS 區域中叫用模型

當您叫用模型時,您可以選擇要在 AWS 區域 其中叫用模型的 。您可以提出之請求的頻率和大小配額取決於 區域。您可以在 Amazon Bedrock 服務配額中搜尋下列配額來尋找這些配額

  • ${Model} 的每分鐘隨需模型推論請求

  • ${Model} 的每分鐘隨需 InvokeModel 權杖

您也可以叫用推論描述檔,而不是基礎模型本身。推論描述檔會定義模型和一個或多個區域,而推論描述檔可將模型調用請求路由到這些區域。透過調用包含多個區域的推論設定檔,您可以提高輸送量。如需詳細資訊,請參閱使用跨區域推論增加輸送量。若要查看您可以使用推論設定檔提出之請求的頻率和大小配額,請在 Amazon Bedrock 服務配額中搜尋下列配額

  • ${Model} 的每分鐘跨區域 InvokeModel 請求

  • ${Model} 的每分鐘跨區域 InvokeModel 權杖

對區域提出的請求可能會在共用相同父區域的本機區域外提供。例如,向美國東部 (維吉尼亞北部) (us-east-1) 提出的請求可能會在與其相關聯的任何本地區域提供,例如亞特蘭大、美國 (us-east-1-atl-2a)。

使用跨區域推論時,適用相同的原則。例如,對美國AnthropicClaude 3 Haiku推論描述檔提出的請求可能會在其父區域位於美國的任何本機區域提供,例如西雅圖、美國 (us-west-2-sea-1a)。將新的本機區域新增至 時 AWS,也會將其新增至對應的跨區域推論端點。

若要查看本機端點及其相關聯的父區域清單,請參閱AWS 本機區域位置