本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
佈建輸送量
當您為模型設定佈建輸送量時,您會以固定成本獲得一定程度的輸送量水平。
您可以將佈建的輸送量與 Amazon 和第三方基本模型以及自訂模型搭配使用。
佈建的輸送量定價會根據您使用的模型和您選擇的承諾等級而有所不同。當您承諾使用較長的時間時,您會收到折扣率。如需每個模型定價的詳細資訊,請參閱 Amazon Bedrock 主控台的模型供應商
根據您是在基礎模型還是自訂模型上執行推論,模型的輸送量選項會有所不同。
注意
在 AWS GovCloud (US) 區域中,您只能為沒有承諾的自訂模型購買佈建輸送量。
定價選項 | 基礎模型 | 自訂模型 |
---|---|---|
佈建的輸送量,無承諾 (每小時計價) | 無 | 可用 (每個帳戶最多 2 個佈建的輸送量) |
佈建的輸送量,承諾 1 個月 | 可用性 | 可用性 |
佈建的輸送量,承諾 6 個月 | 可用性 | 可用性 |
您可以使用模型單位 (MU) 指定佈建的輸送量。模型單位可為指定的模型提供特定的輸送量水平。指定文字模型的 MU 輸送量水平會指定下列項目:
每分鐘的輸入記號總數 — MU 可以在一分鐘內跨越所有請求處理的輸入記號數量。
每分鐘的輸出記號總數 — MU 可以在一分鐘內在所有請求中產生的輸出記號數量。
模型單位配額取決於您為佈建的輸送量指定的承諾等級。
-
對於沒有承諾的自訂模型,每個佈建的輸送量都可以使用一個模型單位的配額。您最多可以在每個帳戶中建立兩個佈建輸出。
-
對於具有承諾產品的基本或自訂模型,預設配額為 0 個模型單位。如要請求增加,請使用限制增加表單
。