Creazione di un cluster SageMaker HyperPod - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un cluster SageMaker HyperPod

Dopo aver configurato tutte le risorse richieste e caricato gli script nel bucket Amazon S3, puoi creare un cluster.

  1. Per creare un cluster, esegui il create-cluster AWS CLI comando. Il completamento del processo può richiedere fino a 15 minuti.

    aws --region $REGION sagemaker create-cluster \ --cluster-name $HP_CLUSTER_NAME \ --vpc-config '{ "SecurityGroupIds":["'$SECURITY_GROUP'"], "Subnets":["'$PRIMARY_SUBNET'", "'$BACKUP_SUBNET'"] }' \ --instance-groups '[{ "InstanceGroupName": "'$CONTOLLER_IG_NAME'", "InstanceType": "ml.t3.medium", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$SLURM_EXECUTION_ROLE_ARN'", "ThreadsPerCore": 1 }, { "InstanceGroupName": "'$COMPUTE_IG_NAME'", "InstanceType": "ml.c5.xlarge", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$COMPUTE_NODE_ROLE'", "ThreadsPerCore": 1 }]'

    Al termine, il comando restituisce l’ARN del cluster come mostrato di seguito.

    { "ClusterArn": "arn:aws:sagemaker:us-east-1:111122223333:cluster/cluster_id" }
  2. (Facoltativo) Per verificare lo stato del cluster, puoi utilizzare la console SageMaker AI (https://console.aws.amazon.com/sagemaker/). Dalla barra di navigazione a sinistra, scegli HyperPod Cluster, quindi scegli Gestione cluster. Scegli il nome del cluster per aprire la relativa pagina dei dettagli. Se il cluster viene creato correttamente, vedrai che lo stato del cluster è InService.

    Immagine che mostra un cluster HyperPod Slurm con più nodi controller nella console Amazon SageMaker AI.