Creazione di SageMaker HyperPod cluster utilizzando modelli CloudFormation - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di SageMaker HyperPod cluster utilizzando modelli CloudFormation

È possibile creare SageMaker HyperPod cluster utilizzando i CloudFormation modelli per HyperPod. È necessario eseguire l'installazione AWS CLI per procedere.

Configura le risorse nella console e distribuiscile utilizzando CloudFormation

È possibile configurare le risorse utilizzando Console di gestione AWS e distribuire utilizzando i CloudFormation modelli.

Segui questa procedura.

  1. Invece di scegliere Invia, scegli Scarica i parametri del CloudFormation modello alla fine del tutorial inGuida introduttiva all' SageMaker HyperPod utilizzo della console SageMaker AI. Il tutorial contiene importanti informazioni di configurazione, necessarie per creare correttamente il cluster.

    Importante

    Se scegli Invia, non sarai in grado di implementare un cluster con lo stesso nome finché non elimini il cluster.

    Dopo aver scelto Scarica i parametri del CloudFormation modello, la finestra Utilizzo del file di configurazione per creare il cluster tramite la AWS CLI finestra apparirà sul lato destro della pagina.

  2. Nella finestra Utilizzo del file di configurazione per creare il cluster con la AWS CLI, scegli Scarica il file dei parametri di configurazione. Il file verrà scaricato sul tuo computer. Puoi modificare il file JSON di configurazione in base alle tue esigenze o lasciarlo così com’è, se non sono necessarie modifiche.

  3. In un terminale, vai alla posizione del file dei parametri file://params.json.

  4. Esegui il AWS CLI comando create-stack per distribuire lo CloudFormation stack che fornirà le risorse configurate e creerà il cluster. HyperPod

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. Per visualizzare lo stato del provisioning delle risorse, accedi alla console. CloudFormation

    Una volta completata la creazione del cluster, visualizza il nuovo cluster in Cluster nel riquadro principale della console. SageMaker HyperPod Puoi anche controllarne lo stato nella colonna Stato.

  6. Quando lo stato del cluster diventa InService, puoi iniziare ad accedere ai nodi del cluster. Per accedere ai nodi del cluster e iniziare a eseguire carichi di lavoro di ML, consulta Lavori su cluster SageMaker HyperPod .

Configura e distribuisci le risorse utilizzando CloudFormation

È possibile configurare e distribuire risorse utilizzando i CloudFormation modelli per. SageMaker HyperPod

Segui questa procedura.

  1. Scarica un CloudFormation modello per SageMaker HyperPod dal sagemaker-hyperpod-cluster-setup GitHub repository.

  2. Esegui il AWS CLI comando create-stack per distribuire lo CloudFormation stack che fornirà le risorse configurate e creerà il cluster. HyperPod

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. Per visualizzare lo stato del provisioning delle risorse, accedere alla console CloudFormation .

    Una volta completata la creazione del cluster, visualizza il nuovo cluster in Clusters nel riquadro principale della console. SageMaker HyperPod Puoi anche controllarne lo stato nella colonna Stato.

  4. Quando lo stato del cluster diventa InService, puoi iniziare ad accedere ai nodi del cluster.