기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 모델에 대한 추론 설정
사용자 지정 모델을 생성한 후 다음 옵션 중 하나를 사용하여 추론을 설정할 수 있습니다.
-
프로비저닝된 처리량 구매 - 모델의 프로비저닝된 처리량을 구매하여 일관된 성능과 짧은 지연 시간을 위해 처리량을 보장하는 전용 컴퓨팅 용량을 설정합니다.
프로비저닝된 처리량에 대한 자세한 내용은 Amazon Bedrock에서 프로비저닝된 처리량으로 모델 간접 호출 용량 증대 섹션을 참조하세요. 프로비저닝된 처리량에서 사용자 지정 모델을 사용하는 방법에 대한 자세한 내용은 섹션을 참조하세요사용자 지정 모델을 위한 프로비저닝된 처리량 구매.
-
온디맨드 추론을 위한 사용자 지정 모델 배포(Amazon Nova모델만 해당) - 온디맨드 추론을 설정하려면 사용자 지정 모델 배포를 사용하여 모델을 배포합니다. 모델을 배포한 후 사용자 지정 모델 배포에 대한 ARN을 사용하여 모델을 호출합니다. 온디맨드 추론을 사용하면 사용한 만큼만 비용을 지불하고 프로비저닝된 컴퓨팅 리소스를 설정할 필요가 없습니다.
온디맨드 추론을 위한 사용자 지정 모델 배포에 대한 자세한 내용은 섹션을 참조하세요온디맨드 추론을 위한 사용자 지정 모델 배포.