Crear un SageMaker HyperPod clúster - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un SageMaker HyperPod clúster

Tras configurar todos los recursos necesarios y cargar los scripts en el bucket de Amazon S3, ya puede crear un clúster.

  1. Para crear un clúster, ejecute el create-cluster AWS CLI comando. El proceso puede tardar 15 minutos en completarse.

    aws --region $REGION sagemaker create-cluster \ --cluster-name $HP_CLUSTER_NAME \ --vpc-config '{ "SecurityGroupIds":["'$SECURITY_GROUP'"], "Subnets":["'$PRIMARY_SUBNET'", "'$BACKUP_SUBNET'"] }' \ --instance-groups '[{ "InstanceGroupName": "'$CONTOLLER_IG_NAME'", "InstanceType": "ml.t3.medium", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$SLURM_EXECUTION_ROLE_ARN'", "ThreadsPerCore": 1 }, { "InstanceGroupName": "'$COMPUTE_IG_NAME'", "InstanceType": "ml.c5.xlarge", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$COMPUTE_NODE_ROLE'", "ThreadsPerCore": 1 }]'

    Una vez ejecutado correctamente, el comando devuelve el ARN del clúster de la forma siguiente.

    { "ClusterArn": "arn:aws:sagemaker:us-east-1:111122223333:cluster/cluster_id" }
  2. (Opcional) Para comprobar el estado del clúster, puede utilizar la consola SageMaker AI (https://console.aws.amazon.com/sagemaker/). En el menú de navegación de la izquierda, selecciona HyperPod Clústeres y, a continuación, Gestión de clústeres. Elija el nombre del clúster para abrir la página de detalles del clúster. Si el clúster se ha creado correctamente, verá que el estado del clúster es InService.

    Imagen que muestra un clúster de HyperPod Slurm con varios nodos de controlador en la consola Amazon SageMaker AI.