HyperPod CLI 및 SDK를 사용하여 모델 훈련 및 배포 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

HyperPod CLI 및 SDK를 사용하여 모델 훈련 및 배포

Amazon SageMaker HyperPod는 대규모 기계 학습 모델을 훈련하고 배포하는 데 도움이 됩니다. AWS HyperPod CLI는 기계 학습(ML) 워크플로를 간소화하는 통합 명령줄 인터페이스입니다 AWS. 인프라 복잡성을 추상화하고 ML 훈련 작업 제출, 모니터링 및 관리를 위한 간소화된 환경을 제공합니다. CLI는 인프라 관리가 아닌 모델 개발에 집중하려는 데이터 과학자와 ML 엔지니어를 위해 특별히 설계되었습니다. 이 주제에서는 PyTorch 모델 훈련, 훈련된 아티팩트를 사용하여 사용자 지정 모델 배포, JumpStart 모델 배포의 세 가지 주요 시나리오를 안내합니다. 처음 사용하는 사용자를 위해 설계된이 간결한 자습서를 사용하면 HyperPod CLI 또는 SDK를 사용하여 모델을 손쉽게 설정, 훈련 및 배포할 수 있습니다. 훈련과 추론 간의 핸드셰이크 프로세스는 모델 아티팩트를 효과적으로 관리하는 데 도움이 됩니다.

사전 조건

Amazon SageMaker HyperPod 사용을 시작하기 전에 다음이 있는지 확인합니다.

  • Amazon SageMaker HyperPod에 액세스할 수 있는 AWS 계정

  • Python 3.9, 3.10 또는 3.11 설치됨

  • AWS CLI 적절한 자격 증명으로 구성됩니다.

HyperPod CLI 및 SDK 설치

CLI 및 SDK에 액세스하는 데 필요한 패키지를 설치합니다.

pip install sagemaker-hyperpod

이 명령은 HyperPod 클러스터와 상호 작용하는 데 필요한 도구를 설정합니다.

클러스터 컨텍스트 구성

HyperPod는 기계 학습에 최적화된 클러스터에서 작동합니다. 먼저 사용 가능한 클러스터를 나열하여 작업에 사용할 클러스터를 선택합니다.

  1. 사용 가능한 모든 클러스터 나열:

    hyp list-cluster
  2. 활성 클러스터를 선택하고 설정합니다.

    hyp set-cluster-context your-eks-cluster-name
  3. 구성을 확인합니다.

    hyp get-cluster-context
참고

모든 후속 명령은 컨텍스트로 설정한 클러스터를 대상으로 합니다.

시나리오 선택

각 시나리오에 대한 자세한 지침을 보려면 아래 주제를 클릭합니다.