

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 실시간 추론
<a name="realtime-endpoints"></a>

 실시간 추론은 실시간, 대화형, 짧은 지연 시간이 요구되는 추론 워크로드에 적합합니다. SageMaker AI 호스팅 서비스에 모델을 배포하고 추론에 사용할 수 있는 엔드포인트를 가져올 수 있습니다. 이러한 엔드포인트는 완전 관리형이며 오토 스케일링을 지원합니다([Amazon SageMaker AI 모델의 자동 규모 조정](endpoint-auto-scaling.md) 참조).

**Topics**
+ [실시간 추론을 위한 모델 배포](realtime-endpoints-deploy-models.md)
+ [실시간 추론을 위한 모델 호출](realtime-endpoints-test-endpoints.md)
+ [엔드포인트](realtime-endpoints-manage.md)
+ [호스팅 옵션](realtime-endpoints-options.md)
+ [Amazon SageMaker AI 모델의 자동 규모 조정](endpoint-auto-scaling.md)
+ [인스턴스 스토리지 볼륨](host-instance-storage.md)
+ [프로덕션 내 모델 검증](model-validation.md)
+ [SageMaker Claify를 통한 온라인 설명 가능성](clarify-online-explainability.md)
+ [어댑터 추론 구성 요소를 사용한 모델 미세 조정](realtime-endpoints-adapt.md)