사용자 지정 모델의 추론 설정

사용자 지정 모델을 생성한 후 다음 옵션 중 하나를 사용하여 추론을 설정할 수 있습니다.

프로비저닝된 처리량 구매 - 모델의 프로비저닝된 처리량을 구매하여 일관된 성능과 짧은 지연 시간을 위해 처리량을 보장하는 전용 컴퓨팅 용량을 설정합니다.

프로비저닝된 처리량에 대한 자세한 내용은 Amazon Bedrock에서 프로비저닝된 처리량으로 모델 간접 호출 용량 증대 섹션을 참조하세요. 프로비저닝된 처리량에서 사용자 지정 모델을 사용하는 방법에 대한 자세한 내용은 사용자 지정 모델을 위한 프로비저닝된 처리량 구매 섹션을 참조하세요.
사용자 지정 모델을 온디맨드 추론용으로 배포하기 – 온디맨드 추론을 설정하려면, 사용자 지정 모델 배포를 통해 모델을 배포합니다. 모델을 배포한 후에는 사용자 지정 모델 배포에 대한 ARN을 사용하여 모델을 간접 호출합니다. 온디맨드 추론을 사용하면 사용한 만큼만 비용을 지불하고 프로비저닝된 컴퓨팅 리소스를 설정할 필요가 없습니다.

온디멘드 추론에 대해 사용자 지정 모델을 배포하는 방법에 대한 자세한 내용은 사용자 지정 모델 온디맨드 추론용 배포 섹션을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

사용자 지정 모델에 대한 세부 정보 확인

사용자 지정 모델을 위한 프로비저닝된 처리량 구매