

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 프로덕션에서 모델을 업데이트하기 위한 배포 가드레일
<a name="deployment-guardrails"></a>

배포 가드레일은 프로덕션 환경에서 기계 학습 모델을 업데이트하기 위한 Amazon SageMaker AI Inference의 모델 배포 옵션 세트입니다. 완전 관리형 배포 옵션으로 프로덕션에 있는 현재 모델에서 새 모델로의 전환을 제어할 수 있습니다. 캐너리 및 리니어와 같은 블루/그린 배포의 트래픽 시프팅 모드를 사용하면 업데이트 과정에서 현재 모델에서 새 모델로의 트래픽 시프팅 프로세스를 세밀하게 제어할 수 있습니다. 또한, 자동 롤백과 같이 기본 제공된 보호 기능을 통해 문제를 조기에 파악하고 프로덕션에 심각한 영향을 미치기 전에 자동으로 수정 조치를 취할 수 있습니다.

배포 가드레일에는 다음과 같은 이점이 있습니다.
+ **프로덕션 환경을 업데이트하는 동안 안전하게 배포할 수 있습니다.** 프로덕션 환경으로 회귀 업데이트하면 모델 지연 시간이 증가하고 오류율이 높아지는 등 예상치 못한 다운타임이 발생하므로 비즈니스에 영향을 미칠 수 있습니다. 배포 가드레일은 모범 사례와 기본 제공된 운영 안전 가드레일을 제공하여 이러한 위험을 완화하는 데 도움이 됩니다.
+ **완전 관리형 배포.** SageMaker AI는 이러한 배포의 설정 및 오케스트레이션을 담당하고 이를 엔드포인트 업데이트 메커니즘과 통합합니다. 오케스트레이션, 모니터링 또는 롤백 메커니즘을 구축하고 유지할 필요가 없습니다. SageMaker AI를 활용하여 이러한 배포를 설정 및 오케스트레이션하고 애플리케이션에 ML을 활용하는 데 집중할 수 있습니다.
+ **표시 여부** [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html) API 또는 Amazon CloudWatch Events([지원되는 엔드포인트](deployment-guardrails-exclusions.md)의 경우)를 통해 배포 진행 상황을 추적할 수 있습니다. SageMaker AI의 이벤트에 대해 자세히 알아보려면 [Amazon SageMaker AI에서 Amazon EventBridge로 보내는 이벤트](automating-sagemaker-with-eventbridge.md)에서 엔드포인트 배포 상태 변경 섹션을 참조하세요. 참고로 엔드포인트가 [제외](deployment-guardrails-exclusions.md) 페이지의 기능 중 하나를 사용하는 경우 CloudWatch Events를 사용할 수 없습니다.

**참고**  
배포 가드레일은 [비동기 추론](async-inference.md) 및 [실시간 추론](realtime-endpoints.md) 엔드포인트 유형에만 적용됩니다.

## 시작하는 방법
<a name="deployment-guardrails-get-started"></a>

프로덕션 환경에서 모델을 업데이트하기 위해 블루/그린 배포와 롤링 배포라는 두 가지 유형의 배포를 지원합니다.
+ [블루/그린 배포](deployment-guardrails-blue-green.md): 업데이트를 통해 기존 플릿(블루 플릿)에서 새 플릿(그린 플릿)으로 트래픽을 시프트할 수 있습니다. 블루/그린 배포는 [다양한 트래픽 시프팅 모드](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-blue-green.html)를 제공합니다. 트래픽 전환 모드는 SageMaker AI가 업데이트가 포함된 새 플릿으로 엔드포인트 트래픽을 라우팅하는 방법을 지정하는 구성입니다. 다음 트래픽 시프팅 모드는 엔드포인트 업데이트 프로세스에 대해 다양한 수준의 제어를 제공합니다.
  + [올앳원스 트래픽 시프팅 사용](deployment-guardrails-blue-green-all-at-once.md)은 모든 엔드포인트 트래픽을 블루 플릿에서 그린 플릿으로 시프팅합니다. 트래픽이 그린 플릿으로 시프팅하면 사전 지정된 Amazon CloudWatch 경보가 설정된 시간(*베이킹 기간*) 동안 그린 플릿을 모니터링하기 시작합니다. 베이킹 기간 동안 경보가 발생하지 않으면 SageMaker AI는 블루 플릿을 종료합니다.
  + [캐너리 트래픽 시프팅 사용](deployment-guardrails-blue-green-canary.md)는 소량의 트래픽(*캐너리*)을 그린 플릿으로 시프팅하고 베이킹 기간 동안 모니터링합니다. 카나리가 그린 플릿에서 성공하면 SageMaker AI는 블루 플릿을 종료하기 전에 나머지 트래픽을 블루 플릿에서 그린 플릿으로 전환합니다.
  + [리니어 트래픽 시프팅 사용](deployment-guardrails-blue-green-linear.md)은 트래픽 시프팅 단계 수와 각 단계에서 시프팅할 트래픽 비율을 훨씬 더 세부적으로 사용자 지정할 수 있는 기능을 제공합니다. 캐너리 시프팅을 사용하면 두 단계로 트래픽을 시프팅할 수 있지만 리니어 시프팅을 사용하면 선형 간격이 *n*단계로 확장됩니다.
+ [롤링 배포 사용](deployment-guardrails-rolling.md): SageMaker AI가 용량을 점진적으로 프로비저닝하고 지정한 배치 크기 단계에 따라 트래픽을 새 플릿으로 전환하므로 엔드포인트를 업데이트할 수 있습니다. 새 플릿의 인스턴스는 새 배포 구성으로 업데이트되며, 베이킹 기간 동안 CloudWatch 경보가 발생하지 않으면 SageMaker AI는 이전 플릿의 인스턴스를 정리합니다. 이 옵션을 사용하면 각 단계에서 시프팅되는 인스턴스 수 또는 용량 비율을 세밀하게 제어할 수 있습니다.

[UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html) 및 [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html) SageMaker API 및 AWS Command Line Interface 명령을 통해 배포를 생성하고 관리할 수 있습니다. 배포 설정 방법에 대한 자세한 내용은 개별 배포 페이지를 참조하세요. 참고로 엔드포인트가 [제외](deployment-guardrails-exclusions.md) 페이지에 나열된 기능 중 하나를 사용하는 경우 배포 가드레일을 사용할 수 없습니다.

배포 가드레일을 사용하는 방법을 보여주는 안내 예제를 따라가려면 캐너리 및 리니어 트래픽 시프팅 모드에 대한 [Jupyter notebook](https://github.com/aws/amazon-sagemaker-examples/tree/master/sagemaker-inference-deployment-guardrails) 예제를 참조하세요.