

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 배치 추론을 사용하여 여러 프롬프트 처리
<a name="batch-inference"></a>

배치 추론을 사용하면 여러 프롬프트를 제출하고 응답을 비동기적으로 생성할 수 있습니다. `InvokeModel` 또는 `Converse` API 형식을 사용하여 입력 데이터의 형식을 지정할 수 있습니다. 배치 추론을 사용하면 단일 요청을 보내고 Amazon S3 버킷에서 응답을 생성하여 많은 수의 요청을 효율적으로 처리할 수 있습니다. 만든 파일에서 모델 입력을 정의한 후 파일을 S3 버킷에 업로드합니다. 그런 다음 배치 추론 요청을 제출하고 S3 버킷을 지정합니다. 작업이 완료되면 S3에서 출력 파일을 검색할 수 있습니다. 배치 추론을 사용하여 대규모 데이터 세트에 대한 모델 추론 성능을 개선할 수 있습니다.

**참고**  
배치 추론은 프로비저닝된 모델에서는 지원되지 않습니다.

배치 추론에 대한 일반적인 정보는 다음 리소스를 참조하세요.
+ 배치 추론에 대한 요금을 확인하려면 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/)을 참조하세요.
+ 배치 추론 할당량을 확인하려면 AWS 일반 참조의 [Amazon Bedrock endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/bedrock.html)를 참조하세요.
+ 배치 추론 작업이 완료되거나 폴링 대신 상태가 변경될 때 알림을 받으려면 섹션을 참조하세요[Amazon EventBridge를 사용하여 Amazon Bedrock 작업 상태 변경 모니터링이벤트 변경 모니터링](monitoring-eventbridge.md).

**Topics**
+ [배치 추론에 지원되는 리전 및 모델](batch-inference-supported.md)
+ [배치 추론을 위한 사전 조건](batch-inference-prereq.md)
+ [배치 추론 작업 생성](batch-inference-create.md)
+ [배치 추론 작업 모니터링](batch-inference-monitor.md)
+ [배치 추론 작업 생성](batch-inference-stop.md)
+ [배치 추론 작업 결과 확인](batch-inference-results.md)
+ [배치 추론의 코드 예제](batch-inference-example.md)
+ [OpenAI Batch API를 사용하여 프롬프트 배치 제출](inference-openai-batch.md)