Amazon Bedrock 中的推論運作方式
當您提交輸入至模型時,該模型會預測隨後的字符的可能序列,並將該序列當作輸出傳回。Amazon Bedrock 提供您使用選擇的基礎模型執行推論的功能。當執行推論時,您會提供下列輸入:
-
提示 – 提供給模型的輸入內容,以從其中產生回應。如需撰寫提示的資訊,請參閱 提示工程概念。如需防止提示注入攻擊的資訊,請參閱 提示注入安全性。
-
模型 – 您向模型提出請求,以在提示時執行推論。您選擇的模型也會指定輸送量層級,定義您可以處理的輸入和輸出字符的數量和速率。您可以向下列類型的模型提出請求:
-
基礎模型 – 用來執行推論的基礎模型。請求會傳送到單一 AWS 區域。如需模型 ID,請參閱 Amazon Bedrock 中支援的基礎模型。如需 Amazon Bedrock 中可用基礎模型的詳細資訊,請參閱 Amazon Bedrock 基礎模型資訊。
-
推論設定檔 – 用來執行推論的基礎模型。對多個 AWS 區域中的模型提出請求。如需推論設定檔 ID,請參閱 推論設定檔支援的區域和模型。
注意
模型的基本模型和推論設定檔可用性會因區域和 API 方法而有所不同。如需詳細資訊,請參閱《基礎模型參考》中的 Amazon Bedrock 中支援的基礎模型 和個別模型頁面。
-
佈建輸送量 – 您已購買專用輸送量的基礎模型。如需詳細資訊,請參閱佈建輸送量
-
自訂模型 – 透過模型自訂修改權重的基礎模型。如需詳細資訊,請參閱 自訂模型,以改善其針對使用案例的效能。
-
-
推論參數 – 可調整一組值,以限制或影響模型回應。如需有關推論參數的詳細資訊,請參閱 使用推論參數影響回應生成 和 基礎模型的推論請求參數和回應欄位。
在不同 AWS 區域中調用模型
當您調用模型時,可以選擇要在其中調用模型的 AWS 區域。您可以提出之請求的頻率和大小配額取決於區域。您可以在 Amazon Bedrock Service Quotas 中搜尋下列配額,以尋找這些配額:
-
${Model}的每分鐘隨需模型推論請求 -
${Model}的每分鐘隨需 InvokeModel 字符
您也可以調用推論設定檔,而不是基礎模型本身。推論設定檔會定義一個模型,以及推論設定檔可將模型調用請求路由至其中的一或多個區域。您可以透過調用包含多個區域的推論設定檔來提高輸送量。如需詳細資訊,請參閱 透過跨區域推論增加輸送量。若要查看您可以使用推論設定檔提出之請求的頻率和大小配額,請在 Amazon Bedrock Service Quotas 中搜尋下列配額:
-
${Model}的每分鐘跨區域 InvokeModel 請求 -
${Model}的每分鐘跨區域 InvokeModel 字符 -
${Model}的每分鐘全域跨區域 InvokeModel 請求 -
${Model}的每分鐘全域跨區域 InvokeModel 字符
對區域提出的請求可能會在共用相同父區域的本機區域外提供。例如,向美國東部 (維吉尼亞北部) (us-east-1) 提出的請求可能會在與其相關聯的任何本地區域提供,例如亞特蘭大、美國 (us-east-1-atl-2a)。
使用跨區域推論時,適用相同的原則。例如,對美國 Anthropic Claude 3 Haiku 推論設定檔提出的請求,可能會在其父區域位於美國的任何本機區域提供,例如西雅圖、美國 (us-west-2-sea-1a)。將新的本機區域新增至 AWS 時,也會將其新增至對應的跨區域推論端點。
若要查看本機端點及其相關聯的父區域清單,請參閱 AWS 本機區域位置
當您在 Amazon Bedrock 中調用跨區域推論設定檔時,您的請求會源自來源區域,並且會自動路由到該設定檔中定義的其中一個目的地區域,以最佳化效能。全域跨區域推論設定檔的目的地區域包含所有商業區域。
特定模型的全域跨區域推論設定檔可能會隨著時間而變更,因為 AWS 會新增更多可處理您請求的商業區域。不過,如果推論設定檔與地理位置 (例如美國、歐洲或亞太區) 繫結,則其目的地區域清單一律不會變更。AWS 可能會建立新的推論設定檔,其中包含新的區域。您可以更新系統來使用這些推論設定檔,方法是將設定中的 ID 變更為新的 ID。
注意
跨區域推論設定檔中的目的地區域可包含選擇加入區域,這是您必須在 AWS 帳戶 或 Organization 層級明確啟用的區域。若要進一步了解,請參閱《在您的帳戶中啟用或停用 AWS 區域》。使用跨區域推論設定檔時,可將您的推論請求路由到設定檔中的任何目的地區域,即使您未選擇加入帳戶中的此類區域也一樣。
服務控制政策 (SCP) 與 AWS Identity and Access Management (IAM) 政策共同運作,以控制允許跨區域推論的位置。您可以使用 SCP 來控制 Amazon Bedrock 可以使用哪些區域進行推論,並使用 IAM 政策來定義哪些使用者或角色具有執行推論的許可。如果跨區域推論設定檔中的任何目的地區域在 SCP 中遭到封鎖,則即使仍允許其他區域,請求也會失敗。為了確保跨區域推論的有效操作,您可以更新 SCP 和 IAM 政策,以允許在所選推論設定檔中包含的所有目的地區域中執行所有必要的 Amazon Bedrock 推論動作 (例如 bedrock:InvokeModel* 或 bedrock:CreateModelInvocationJob)。若要進一步了解,請參閱《https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/