

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon SageMaker Studio를 사용하여 JumpStart에서 모델 배포
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui"></a>

다음 단계에서는 Amazon SageMaker Studio를 사용하여 JumpStart에서 모델을 배포하는 방법을 보여줍니다.

## 사전 조건
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-prereqs"></a>

Amazon SageMaker HyperPod 클러스터에서 추론 기능을 설정했는지 확인합니다. 자세한 내용은 [모델 배포를 위한 HyperPod 클러스터 설정](sagemaker-hyperpod-model-deployment-setup.md) 단원을 참조하십시오.

## HyperPod 배포 생성
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-create"></a>

1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 **JumpStart** 랜딩 페이지를 엽니다.

1. **모든 퍼블릭 모델**에서 배포하려는 모델을 선택합니다.
**참고**  
게이트 모델을 선택한 경우 최종 사용자 라이선스 계약(EULA)에 동의해야 합니다.

1. **SageMaker HyperPod**를 선택합니다.

1. **배포 설정**에서 JumpStart는 배포를 위한 인스턴스를 추천합니다. 필요한 경우 이 설정을 수정할 수 있습니다.

   1. **인스턴스 유형**을 수정하는 경우 선택한 **HyperPod 클러스터**와 호환되는지 확인합니다. 호환되는 인스턴스가 없는 경우 새 **HyperPod 클러스터**를 선택하거나 관리자에게 클러스터에 호환되는 인스턴스를 추가해 달라고 요청해야 합니다.

   1. 모델 배포의 우선순위를 지정하려면 태스크 거버넌스 추가 기능을 설치하고, 컴퓨팅 할당을 생성하고, 클러스터 정책에 대한 작업 순위를 설정합니다. 이 작업이 완료되면 모델 배포의 우선순위를 선택하는 옵션이 표시됩니다. 이 우선순위를 사용해 클러스터에서 다른 배포 및 작업을 선점할 수 있습니다.

   1. 관리자가 액세스 권한을 제공한 네임스페이스를 입력합니다. 정확한 네임스페이스를 가져오려면 관리자에게 직접 문의해야 할 수 있습니다. 유효한 네임스페이스가 제공되면 모델을 배포하기 위한 **배포** 버튼이 활성화됩니다.

   1. 인스턴스 유형이 분할된 경우(MIG 활성화됨) **GPU 파티션 유형을** 선택합니다.

   1. LLM 추론 속도를 높이기 위해 L2 KVCache 또는 Intelligent Routing을 활성화하려면 활성화하세요. 기본적으로 L1 KV 캐시만 활성화됩니다. KVCache 및 Intelligent Routing에 대한 자세한 내용은 [SageMaker HyperPod 모델 배포](sagemaker-hyperpod-model-deployment.md)를 참조하세요.

1. **배포**를 선택하고 **엔드포인트**가 생성될 때까지 기다립니다.

1. **엔드포인트**가 생성되면 **추론 테스트**를 선택합니다.

## HyperPod 배포 편집
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-edit"></a>

1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 **컴퓨팅**을 선택한 다음 **HyperPod 클러스터**를 선택합니다.

1. **배포**에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

1. 세로 줄임표 아이콘(⋮)에서 **편집**을 선택합니다.

1. **배포 설정**에서 **오토 스케일링**을 활성화 또는 비활성화하고 **최대 복제본** 수를 변경할 수 있습니다.

1. **저장**을 선택합니다.

1. **상태**가 **업데이트 중**으로 변경됩니다. **서비스 중**으로 다시 변경되면 변경 사항 적용이 완료되고 확인 메시지가 표시됩니다.

## HyperPod 배포 삭제
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-delete"></a>

1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 **컴퓨팅**을 선택한 다음 **HyperPod 클러스터**를 선택합니다.

1. **배포**에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

1. 세로 줄임표 아이콘(⋮)에서 **삭제**를 선택합니다.

1. **HyperPod 배포 삭제 창**에서 확인란을 선택합니다.

1. **삭제**를 선택합니다.

1. **상태**가 **삭제 중**으로 변경됩니다. HyperPod 배포가 삭제되면 이를 확인하는 메시지가 표시됩니다.