Amazon SageMaker Studio를 사용하여 JumpStart에서 모델 배포 - Amazon SageMaker AI

Amazon SageMaker Studio를 사용하여 JumpStart에서 모델 배포

다음 단계에서는 Amazon SageMaker Studio를 사용하여 JumpStart에서 모델을 배포하는 방법을 보여줍니다.

사전 조건

Amazon SageMaker HyperPod 클러스터에서 추론 기능을 설정했는지 확인합니다. 자세한 내용은 모델 배포를 위한 HyperPod 클러스터 설정 섹션을 참조하세요.

HyperPod 배포 생성

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 JumpStart 랜딩 페이지를 엽니다.

  2. 모든 퍼블릭 모델에서 배포하려는 모델을 선택합니다.

    참고

    게이트 모델을 선택한 경우 최종 사용자 라이선스 계약(EULA)에 동의해야 합니다.

  3. SageMaker HyperPod를 선택합니다.

  4. 배포 설정에서 JumpStart는 배포를 위한 인스턴스를 추천합니다. 필요한 경우 이 설정을 수정할 수 있습니다.

    1. 인스턴스 유형을 수정하는 경우 선택한 HyperPod 클러스터와 호환되는지 확인합니다. 호환되는 인스턴스가 없는 경우 새 HyperPod 클러스터를 선택하거나 관리자에게 클러스터에 호환되는 인스턴스를 추가해 달라고 요청해야 합니다.

    2. 모델 배포의 우선순위를 지정하려면 태스크 거버넌스 추가 기능을 설치하고, 컴퓨팅 할당을 생성하고, 클러스터 정책에 대한 작업 순위를 설정합니다. 이 작업이 완료되면 모델 배포의 우선순위를 선택하는 옵션이 표시됩니다. 이 우선순위를 사용해 클러스터에서 다른 배포 및 작업을 선점할 수 있습니다.

    3. 관리자가 액세스 권한을 제공한 네임스페이스를 입력합니다. 정확한 네임스페이스를 가져오려면 관리자에게 직접 문의해야 할 수 있습니다. 유효한 네임스페이스가 제공되면 모델을 배포하기 위한 배포 버튼이 활성화됩니다.

  5. 배포를 선택하고 엔드포인트가 생성될 때까지 기다립니다.

  6. 엔드포인트가 생성되면 추론 테스트를 선택합니다.

HyperPod 배포 편집

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 컴퓨팅을 선택한 다음 HyperPod 클러스터를 선택합니다.

  2. 배포에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

  3. 세로 줄임표 아이콘(⋮)에서 편집을 선택합니다.

  4. 배포 설정에서 오토 스케일링을 활성화 또는 비활성화하고 최대 복제본 수를 변경할 수 있습니다.

  5. 저장을 선택합니다.

  6. 상태업데이트 중으로 변경됩니다. 서비스 중으로 다시 변경되면 변경 사항 적용이 완료되고 확인 메시지가 표시됩니다.

HyperPod 배포 삭제

  1. Amazon SageMaker Studio의 왼쪽 탐색 창에서 컴퓨팅을 선택한 다음 HyperPod 클러스터를 선택합니다.

  2. 배포에서 수정하려는 HyperPod 클러스터 배포를 선택합니다.

  3. 세로 줄임표 아이콘(⋮)에서 삭제를 선택합니다.

  4. HyperPod 배포 삭제 창에서 확인란을 선택합니다.

  5. 삭제를 선택합니다.

  6. 상태삭제 중으로 변경됩니다. HyperPod 배포가 삭제되면 이를 확인하는 메시지가 표시됩니다.