기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
프로비저닝된 처리량
모델에 프로비저닝된 처리량을 구성하면 고정 비용으로 일정 수준의 처리량을 수신하게 됩니다.
Amazon 및 타사의 기본 모델과 사용자 지정 모델을 활용하여 프로비저닝된 처리량을 사용할 수 있습니다.
프로비저닝된 처리량 요금은 사용하는 모델과 선택한 약정 수준에 따라 달라집니다. 약정 기간이 길수록 할인된 요금이 적용됩니다. 각 모델의 요금에 대한 자세한 내용은 Amazon Bedrock 콘솔의 모델 제공업체
모델의 처리량 옵션은 추론을 기본 모델에서 실행하는지 또는 사용자 지정 모델에서 실행하는지에 따라 달라집니다.
참고
AWS GovCloud (US) 리전에서는 커밋 없이 사용자 지정 모델의 프로비저닝된 처리량만 구매할 수 있습니다.
요금 옵션 | 기본 모델 | 사용자 지정 모델 |
---|---|---|
프로비저닝된 처리량, 무약정(시간당 요금) | 사용할 수 없음 | 사용 가능(계정당 최대 2개의 프로비저닝된 처리량) |
프로비저닝된 처리량, 1개월 약정 | 사용 가능 | Available |
프로비저닝된 처리량, 6개월 약정 | 사용 가능 | Available |
프로비저닝된 처리량은 모델 단위(MU)로 지정합니다. 모델 단위는 지정된 모델에 대해 특정 수준의 처리량을 제공합니다. 주어진 텍스트 모델에 대한 MU의 처리량 수준은 다음 항목을 지정합니다.
분당 총 입력 토큰 수 - MU가 1분 동안 모든 요청 전체에서 처리할 수 있는 입력 토큰 수입니다.
분당 총 출력 토큰 수 - MU가 1분 동안 모든 요청 전체에서 생성할 수 있는 출력 토큰 수입니다.
모델 단위 할당량은 프로비저닝된 처리량에 지정한 약정 수준에 따라 달라집니다.
-
무약정 사용자 지정 모델의 경우, 각각의 프로비저닝된 처리량에 대해 사용할 수 있는 모델 단위 할당량은 1개입니다. 계정당 최대 2개의 프로비저닝된 처리량을 생성할 수 있습니다.
-
약정이 있는 기본 모델 또는 사용자 지정 모델의 경우, 기본 모델 단위 할당량은 0개입니다. 할당량 증가를 요청하려면 한도 증가 양식
을 사용하세요.