Amazon Bedrock 的配額 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Bedrock 的配額

您的 AWS 帳戶 具有 Amazon Bedrock 的預設配額,先前稱為限制。若要檢視 Amazon Bedrock 的服務配額,請執行下列其中一項操作:

為了維持服務的效能並確保適當使用 Amazon Bedrock,指派給帳戶的預設配額可能會根據區域因素、付款歷史記錄、詐騙使用量和/或配額增加請求的核准而更新。

注意

為了維持效能並確保適當使用 Amazon Bedrock, 會根據您帳戶的每分鐘請求 (RPM)、每分鐘字符 (TPM) 和每日字符 (TPD) 配額 AWS 來限制您的用量。預設權杖每日限制為權杖每分鐘 * 24 * 60。不過,新的 AWS 帳戶 減少了每日權杖的配額。您可以請求提高配額,如下節所述。

若要檢視您帳戶的權杖每日限制,請在 AWS Management Console Service Quotas頁面中選取 Amazon Bedrock,並搜尋「每天 ${MODEL} 模型調用權杖上限」。

請求提高 Amazon Bedrock 配額

請求提高帳戶配額的步驟取決於 Amazon Bedrock 服務配額中配額表中可調整欄中的值:

  • 如果配額標示為,您可以依照 Service Quotas 使用者指南中的請求配額增加中的步驟進行調整。

  • 對於任何模型,您可以同時請求增加下列配額:

    • ${model} 的每分鐘跨區域 InvokeModel 權杖

    • ${model} 的每分鐘跨區域 InvokeModel 請求

    • ${model} 的每分鐘隨需 InvokeModel 權杖

    • ${model} 的每分鐘隨需 InvokeModel 請求

    • ${model} 每天模型調用權杖上限

    若要請求提高這些配額的任意組合,請遵循 Service Quotas 使用者指南中的請求提高配額中的步驟,請求提高 ${model} 配額的跨區域 InvokeModel 字符/分鐘。這麼做之後,支援團隊會與您聯絡,並提供您同時提高其他四個配額的選項。

    注意

    由於需求過大,產生耗用現有配額分配流量的客戶將優先考慮。如果您不符合此條件,您的請求可能會被拒絕。

4 AnthropicClaude 個模型的字符銷毀率

具有非標準字符銷毀率的模型的推論配額。

Amazon Bedrock 模型推論配額以兩個維度測量:RPM (每分鐘請求數) 和 TPM (每分鐘權杖數)。配額可以跨任何維度命中,具體取決於最先發生的情況。

縮減率是調節系統將輸入和輸出字符轉換為字符配額用量的比率。此比率代表輸入和輸出字符計入字符配額的速率。

大多數模型每個 1 個輸入都有 1 個字符或 1 個輸出字符,但 Anthropic Claude 4 個模型除外。如需 Anthropic Claude 4 個停機時間費率,請參閱下表。如需在 Amazon Bedrock 中使用字符和定價的詳細資訊,請參閱 Amazon Bedrock 定價

我們會在收到您的請求時,使用 API 請求中指定的max_tokens值來預估權杖配額的輸出縮減。我們會在請求完成時,將輸出縮減調整為實際用量。若要避免提早限流,請選取接近您預期輸出字符max_tokens的值。

模型字符非標準燒毀率

模型

輸入字符

輸出字符

Claude Opus 4

每個輸入字符 1 個字符

每個輸出字符 5 個字符

Claude Sonnet 4

每個輸入字符 1 個字符

每個輸出字符 5 個字符