本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Bedrock 的配額
您的 AWS 帳戶 具有 Amazon Bedrock 的預設配額,先前稱為限制。若要檢視 Amazon Bedrock 的服務配額,請執行下列其中一項操作:
-
請遵循檢視服務配額中的步驟,然後選取 Amazon Bedrock 做為服務。
-
請參閱 中的 Amazon Bedrock 服務配額 AWS 一般參考。
為了維持服務的效能並確保適當使用 Amazon Bedrock,指派給帳戶的預設配額可能會根據區域因素、付款歷史記錄、詐騙使用量和/或配額增加請求的核准而更新。
注意
為了維持效能並確保適當使用 Amazon Bedrock, 會根據您帳戶的每分鐘請求 (RPM)、每分鐘字符 (TPM) 和每日字符 (TPD) 配額 AWS 來限制您的用量。預設權杖每日限制為權杖每分鐘 * 24 * 60。不過,新的 AWS 帳戶 減少了每日權杖的配額。您可以請求提高配額,如下節所述。
若要檢視您帳戶的權杖每日限制,請在 AWS Management Console Service Quotas
請求提高 Amazon Bedrock 配額
請求提高帳戶配額的步驟取決於 Amazon Bedrock 服務配額中配額表中可調整欄中的值:
-
如果配額標示為是,您可以依照 Service Quotas 使用者指南中的請求配額增加中的步驟進行調整。
-
對於任何模型,您可以同時請求增加下列配額:
-
${model}
的每分鐘跨區域 InvokeModel 權杖 -
${model}
的每分鐘跨區域 InvokeModel 請求 -
${model}
的每分鐘隨需 InvokeModel 權杖 -
${model}
的每分鐘隨需 InvokeModel 請求 -
${model}
每天模型調用權杖上限
若要請求提高這些配額的任意組合,請遵循 Service Quotas 使用者指南中的請求提高配額中的步驟,請求提高
${model}
配額的跨區域 InvokeModel 字符/分鐘。這麼做之後,支援團隊會與您聯絡,並提供您同時提高其他四個配額的選項。注意
由於需求過大,產生耗用現有配額分配流量的客戶將優先考慮。如果您不符合此條件,您的請求可能會被拒絕。
-
4 AnthropicClaude 個模型的字符銷毀率
具有非標準字符銷毀率的模型的推論配額。
Amazon Bedrock 模型推論配額以兩個維度測量:RPM (每分鐘請求數) 和 TPM (每分鐘權杖數)。配額可以跨任何維度命中,具體取決於最先發生的情況。
縮減率是調節系統將輸入和輸出字符轉換為字符配額用量的比率。此比率代表輸入和輸出字符計入字符配額的速率。
大多數模型每個 1 個輸入都有 1 個字符或 1 個輸出字符,但 Anthropic Claude 4 個模型除外。如需 Anthropic Claude 4 個停機時間費率,請參閱下表。如需在 Amazon Bedrock 中使用字符和定價的詳細資訊,請參閱 Amazon Bedrock 定價
我們會在收到您的請求時,使用 API 請求中指定的max_tokens
值來預估權杖配額的輸出縮減。我們會在請求完成時,將輸出縮減調整為實際用量。若要避免提早限流,請選取接近您預期輸出字符max_tokens
的值。
模型 |
輸入字符 |
輸出字符 |
---|---|---|
Claude Opus 4 |
每個輸入字符 1 個字符 |
每個輸出字符 5 個字符 |
Claude Sonnet 4 |
每個輸入字符 1 個字符 |
每個輸出字符 5 個字符 |