기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Bedrock의 할당량
AWS 계정 에는 Amazon Bedrock에 대한 이전 제한이라고 하는 기본 할당량이 있습니다. Amazon Bedrock의 서비스 할당량을 보려면 다음 중 하나를 수행합니다.
-
Viewing service quotas의 단계에 따라 서비스로 Amazon Bedrock을 선택합니다.
-
의 Amazon Bedrock 서비스 할당량을 참조하세요 AWS 일반 참조.
서비스 성능을 유지하고 Amazon Bedrock을 적절하게 사용할 수 있도록, 계정에 할당된 기본 할당량은 지역적 요인, 결제 기록, 사기성 사용 및/또는 할당량 증가 요청 승인에 따라 업데이트될 수 있습니다.
참고
성능을 유지하고 Amazon Bedrock의 적절한 사용을 보장하기 위해는 분당 요청 수(RPM), 분당 토큰 수(TPM), 일일 토큰 수(TPD)에 대한 계정의 할당량에 따라 사용량을 AWS 제한합니다. 기본 일일 토큰 한도는 분당 토큰 * 24 * 60입니다. 그러나 새 AWS 계정 는 일일 토큰 할당량을 줄였습니다. 다음 섹션에 설명된 대로 할당량 증가를 요청할 수 있습니다.
계정의 일일 토큰 한도를 보려면 AWS Management Console Service Quotas
Amazon Bedrock 할당량 증가 요청
계정에 대한 할당량 증가를 요청하는 단계는 Amazon Bedrock 서비스 할당량에 있는 할당량 테이블의 조정 가능 열에 있는 값에 따라 달라집니다.
-
할당량이 예로 표시된 경우 Service Quotas 사용 설명서의 할당량 증가 요청 단계에 따라 할당량을 조정할 수 있습니다.
-
모든 모델의 경우 다음 할당량 증가를 함께 요청할 수 있습니다.
-
${model}
에 대한 분당 리전 간 InvokeModel 토큰 -
${model}
에 대한 분당 리전 간 InvokeModel 요청 -
${model}
에 대한 분당 온디맨드 InvokeModel 토큰 -
${model}
에 대한 분당 온디맨드 InvokeModel 요청 -
${model}
에 대한 일일 모델 호출 최대 토큰
이러한 할당량의 조합에 대한 증가를 요청하려면 Service Quotas 사용 설명서의 할당량 증가 요청의 단계에 따라
${model}
할당량에 대한 분당 리전 간 InvokeModel 토큰 증가를 요청하세요. https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html 이렇게 하면 지원 팀이 연락하여 다른 4가지 할당량을 늘릴 수 있는 옵션도 제공합니다.참고
수요가 압도적인 관계로, 기존에 할당된 할당량을 소비하는 트래픽을 생성하는 고객에게 우선 순위가 부여됩니다. 이 조건을 충족하지 않으면 요청이 거부될 수 있습니다.
-
4AnthropicClaude개 모델의 토큰 연소율
비표준 토큰 연소율이 있는 모델의 추론 할당량입니다.
Amazon Bedrock 모델 추론 할당량은 RPM(분당 요청 수)과 TPM(분당 토큰 수)의 두 가지 차원으로 측정됩니다. 먼저 발생하는 상황에 따라 모든 차원에서 할당량에 도달할 수 있습니다.
연소율은 입력 및 출력 토큰을 제한 시스템의 토큰 할당량 사용량으로 변환하는 비율입니다. 이 비율은 입력 및 출력 토큰이 토큰 할당량에 포함되는 속도를 나타냅니다.
대부분의 모델은 모델 AnthropicClaude4개를 제외하고 입력 1개당 토큰 1개 또는 출력 토큰 1개의 연소율을 갖습니다. 4개의 연소율은 아래 Anthropic Claude 표를 참조하세요. Amazon Bedrock의 토큰 사용 및 요금에 대한 자세한 내용은 Amazon Bedrock 요금을
API 요청에 지정된 max_tokens
값을 사용하여 요청을 수신할 때 토큰 할당량에 대한 출력 연소를 추정합니다. 요청 완료 시 출력 연소를 실제 사용량에 맞게 조정합니다. 초기 제한을 방지하려면 예상 출력 토큰에 가까운 max_tokens
값을 선택합니다.
모델 |
입력 토큰 |
출력 토큰 |
---|---|---|
Claude Opus 4 |
입력 토큰당 토큰 1개 |
출력 토큰당 토큰 5개 |
Claude Sonnet 4 |
입력 토큰당 토큰 1개 |
출력 토큰당 토큰 5개 |