

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 엔드포인트에 모델 배포
<a name="canvas-deploy-model"></a>

Amazon SageMaker Canvas에서는 모델을 엔드포인트에 배포하여 예측을 수행할 수 있습니다. SageMaker AI는 선택한 컴퓨팅 인스턴스를 사용하여 엔드포인트에서 모델을 호스팅할 수 있는 ML 인프라를 제공합니다. 그런 다음 엔드포인트를 *호출*(예측 요청 전송)하고 모델에서 실시간 예측을 가져올 수 있습니다. 이 기능을 사용하면 프로덕션에서 모델을 사용하여 들어오는 요청에 응답하고 모델을 기존 애플리케이션 및 워크플로와 통합할 수 있습니다.

시작하려면 배포할 모델이 있어야 합니다. 빌드한 사용자 지정 모델 버전, Amazon SageMaker JumpStart 파운데이션 모델 및 미세 조정된 JumpStart 파운데이션 모델을 배포할 수 있습니다. 모델 구축에 대한 추가 정보는 [사용자 지정 모델 작동 방식](canvas-build-model.md)을 참조하세요. Canvas의 JumpStart 파운데이션 모델에 대한 자세한 내용은 [SageMaker Canvas의 생성형 AI 파운데이션 모델](canvas-fm-chat.md) 섹션을 참조하세요.

**다음 **권한 관리** 섹션을 검토한 다음 모델 배포 섹션에서 새 배포를 생성하세요.**

## 권한 관리
<a name="canvas-deploy-model-prereqs"></a>

기본적으로 사용자에게는 SageMaker AI 호스팅 엔드포인트에 모델을 배포할 권한이 있습니다. SageMaker AI는 Canvas 애플리케이션을 호스팅하는 SageMaker AI 도메인의 AWS IAM 실행 역할에 연결된 [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html) 정책을 통해 모든 신규 및 기존 Canvas 사용자 프로필에 이러한 권한을 부여합니다.

Canvas 관리자가 새 도메인 또는 사용자 프로필을 설정하는 경우, 도메인을 설정하고 [Amazon SageMaker Canvas를 설정하기 위한 사전 조건](canvas-getting-started.md#canvas-prerequisites)의 사전 요구 사항 지침을 따를 때 SageMaker AI는 기본적으로 활성화되는 **Canvas 모델의 직접 배포 활성화** 옵션을 통해 모델 배포 권한을 활성화합니다.

Canvas 관리자는 사용자 프로필 수준에서도 모델 배포 권한을 관리할 수 있습니다. 예를 들어 관리자가 도메인을 설정할 때 모든 사용자 프로필에 모델 배포 권한을 부여하지 않으려는 경우 도메인을 만든 후 특정 사용자에게 권한을 부여할 수 있습니다.

다음 절차는 특정 사용자 프로필에 대한 모델 배포 권한을 수정하는 방법을 보여줍니다.

1. [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)에서 SageMaker AI 콘솔을 엽니다.

1. 왼쪽 탐색 창에서 **관리자 구성**을 선택합니다.

1. **관리자 구성**에서 **도메인**을 선택합니다.

1. 도메인 목록에서 사용자 프로필의 도메인을 선택합니다.

1. **도메인 세부 정보** 페이지에서 **사용자 프로필** 탭을 선택합니다.

1. 본인의 **사용자 프로필**을 선택합니다.

1. 사용자 프로필 페이지에서 **앱 구성** 탭을 선택합니다.

1. **Canvas** 섹션에서 **편집**을 선택합니다.

1. **ML 운영 구성** 섹션에서 **Canvas 모델 직접 배포 활성화** 토글을 켜서 배포 권한을 활성화합니다.

1. **제출**을 선택하여 도메인 설정 변경 내용을 저장합니다.

이제 사용자 프로필에 모델 배포 권한이 없습니다.

도메인 또는 사용자 프로필에 권한을 부여한 후 사용자가 Canvas 애플리케이션에서 로그아웃하고 다시 로그인하여 권한 변경 사항을 적용하도록 해야 합니다.

## 모델 배포
<a name="canvas-deploy-model-deploy"></a>

모델 배포를 시작하려면 Canvas에서 새 배포를 만들고 ML 인프라와 함께 배포할 모델 버전(예: 모델 호스팅에 사용할 컴퓨팅 인스턴스의 유형 및 수)을 지정합니다.

Canvas는 모델 유형에 따라 기본 유형 및 인스턴스 수를 제안하거나 [Amazon SageMaker 요금 페이지](https://aws.amazon.com/sagemaker/pricing/)에서 다양한 SageMaker AI 인스턴스 유형에 대해 자세히 알아볼 수 있습니다. 엔드포인트가 활성화되어 있는 동안에는 SageMaker AI 인스턴스 요금을 기준으로 요금이 부과됩니다.

JumpStart 파운데이션 모델을 배포할 때 배포 시간의 기간을 지정하는 옵션도 있습니다. 모델을 엔드포인트에 무기한 배포할 수 있습니다(즉, 배포를 삭제할 때까지 엔드포인트가 활성 상태임). 또는 단기간만 엔드포인트가 필요하고 비용을 절감하려는 경우 지정된 시간 동안 엔드포인트에 모델을 배포할 수 있습니다. 이 시간이 지나면 SageMaker AI가 엔드포인트를 종료합니다.

**참고**  
지정된 시간 동안 모델을 배포하는 경우 엔드포인트 기간 동안 Canvas 애플리케이션에 로그인한 상태를 유지합니다. 애플리케이션에서 로그아웃하거나 애플리케이션을 삭제하면 Canvas가 지정된 시간에 엔드포인트를 종료할 수 없습니다.

SageMaker AI 호스팅 [실시간 추론](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html) 엔드포인트에 모델을 배포한 후 엔드포인트를 *간접 호출*하여 예측을 시작할 수 있습니다.

Canvas 애플리케이션에서 모델을 배포하는 방법에는 여러 가지가 있습니다. 다음 방법 중 하나를 통해 모델 배포 옵션에 액세스할 수 있습니다.
+ Canvas 애플리케이션의 **내 모델** 페이지에서 배포하려는 모델을 선택합니다. 그런 다음 모델의 **버전** 페이지에서 모델 버전 옆에 있는 **추가 옵션** 아이콘(![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))을 선택하고 **배포**를 선택합니다.
+ 모델 버전의 세부 정보 페이지의 **분석** 탭에서 **배포** 옵션을 선택합니다.
+ 모델 버전의 세부 정보 페이지에 있는 **예측** 탭에서 페이지 상단의 **추가 옵션** 아이콘(![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/ko_kr/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png))을 선택하고 **배포**를 선택합니다.
+ Canvas 애플리케이션의 **ML 운영** 페이지에서 **배포** 탭을 선택한 다음 **배포 만들기**를 선택합니다.
+ JumpStart 파운데이션 모델 및 미세 조정된 파운데이션 모델의 경우 Canvas 애플리케이션의 **즉시 사용 가능 모델** 페이지로 이동합니다. **콘텐츠 생성, 추출 및 요약**을 선택합니다. 그런 다음 배포하려는 JumpStart 파운데이션 모델 또는 미세 조정 파운데이션 모델을 찾습니다. 모델을 선택하고 모델의 채팅 페이지에서 **배포** 버튼을 선택합니다.

이러한 모든 방법을 사용하면 **배포 모델** 사이드 패널이 열리고, 여기서 모델의 배포 구성을 지정할 수 있습니다. 이 패널에서 모델을 배포하려면 다음 작업을 수행합니다.

1. (선택 사항) **ML 운영** 페이지에서 배포를 만드는 경우 **모델 및 버전 선택** 옵션이 제공됩니다. 드롭다운 메뉴를 사용하여 배포하려는 모델 및 모델 버전을 선택합니다.

1. **배포 이름** 필드에 이름을 입력합니다.

1. (JumpStart 파운데이션 모델 및 미세 조정 파운데이션 모델만 해당) **배포 기간**을 선택합니다. 엔드포인트를 종료할 때까지 엔드포인트를 활성 상태로 두려면 **무기한**을 선택합니다. 아니면 **기간 지정**을 선택하고 엔드포인트가 활성 상태로 유지될 기간을 입력합니다.

1. **인스턴스 유형**의 경우 SageMaker AI는 모델에 적합한 기본 인스턴스 유형 및 번호를 감지합니다. 하지만 모델 호스팅에 사용하려는 인스턴스 유형은 변경할 수 있습니다.
**참고**  
 AWS 계정에서 선택한 인스턴스 유형에 대한 인스턴스 할당량이 부족한 경우 할당량 증가를 요청할 수 있습니다. 기본 할당량 및 증가를 요청하는 방법에 대한 자세한 내용은 *AWS 일반 참조 가이드*의 [Amazon SageMaker 엔드포인트 및 할당량](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html)을 참조하세요.

1. **인스턴스 수**에서는 엔드포인트에 사용되는 활성 인스턴스 수를 설정할 수 있습니다. SageMaker AI는 모델에 적합한 기본 번호를 감지하지만 이 번호는 변경할 수 있습니다.

1. 모델을 배포할 준비가 되면 **배포** 를 선택합니다.

이제 모델을 엔드포인트에 배포해야 합니다.