기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon SageMaker AI에서 모델을 배포하고 추론을 가져오는 옵션 이해
SageMaker AI 추론을 시작하는 데 도움이 되도록 SageMaker AI에 모델을 배포하고 추론을 가져오는 옵션을 설명하는 다음 섹션을 참조하세요. 이 Amazon SageMaker AI의 추론 옵션 섹션에서는 추론 사용 사례에 가장 적합한 기능을 결정하는 데 도움이 될 수 있습니다.
자세한 문제 해결 및 참조 정보, 시작하는 데 도움이 되는 블로그 및 예제, 일반적인 FAQ는 리소스 섹션을 참조하세요.
주제
시작하기 전 준비 사항
이들 항목에서는 하나 이상의 기계 학습 모델을 빌드 및 훈련하여 배포할 준비를 마쳤다고 가정합니다. SageMaker AI에서 모델을 훈련시키지 않아도 SageMaker AI에서 모델을 배포하고 추론을 가져올 수 있습니다. 자체 모델이 없는 경우, SageMaker AI의 기본 제공 알고리즘 또는 사전 훈련된 모델을 사용할 수 있습니다.
SageMaker AI를 처음 사용하고 배포할 모델을 선택하지 않은 경우 Amazon SageMaker AI 시작하기 자습서에 나와 있는 단계에 따라 진행합니다. 자습서를 사용하여 SageMaker AI가 데이터 과학 프로세스를 관리하는 방법과 모델 배포를 처리하는 방법을 숙지합니다. 모델 훈련에 대한 자세한 정보는 모델 훈련에서 확인하세요.
추가 정보, 참조, 예제는 리소스에서 확인하세요.
모델 배포 단계
추론 엔드포인트의 일반 워크플로는 다음과 같은 요소로 구성됩니다.
Amazon S3에 저장된 모델 아티팩트와 컨테이너 이미지를 가리켜 SageMaker AI Inference에서 모델을 만듭니다.
추론 옵션을 선택합니다. 자세한 내용은 Amazon SageMaker AI의 추론 옵션 섹션을 참조하세요.
엔드포인트 뒤에 필요한 인스턴스 유형과 인스턴스 수를 선택하여 SageMaker AI Inference 엔드포인트 구성을 만듭니다. Amazon SageMaker Inference Recommender로 인스턴스 유형 권장 사항 가져오기가 가능합니다. 서버리스 추론의 경우 모델 크기에 따라 필요한 메모리 구성만 제공하면 됩니다.
SageMaker AI Inference 엔드포인트를 만듭니다.
엔드포인트를 호출하여 추론을 응답으로 수신합니다.
다음 다이어그램에서 이전 워크플로를 볼 수 있습니다.
AWS 콘솔, AWS SDK, SageMaker Python SDK, CloudFormation 또는 AWS CLI(으)로 이러한 작업을 수행할 수 있습니다.
일괄 변환을 적용한 일괄 추론의 경우, 모델 아티팩트와 입력 데이터를 가리키고 일괄 추론 작업을 생성합니다. SageMaker AI는 추론을 위한 엔드포인트를 호스팅하는 대신 사용자가 선택한 Amazon S3 위치로 추론을 출력합니다.