Criação de um SageMaker HyperPod cluster - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de um SageMaker HyperPod cluster

Depois de configurar todos os recursos necessários e fazer upload dos scripts no bucket do Amazon S3, você pode criar um cluster.

  1. Para criar um cluster, execute o create-cluster AWS CLI comando. O processo de criação pode levar até 15 minutos.

    aws --region $REGION sagemaker create-cluster \ --cluster-name $HP_CLUSTER_NAME \ --vpc-config '{ "SecurityGroupIds":["'$SECURITY_GROUP'"], "Subnets":["'$PRIMARY_SUBNET'", "'$BACKUP_SUBNET'"] }' \ --instance-groups '[{ "InstanceGroupName": "'$CONTOLLER_IG_NAME'", "InstanceType": "ml.t3.medium", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$SLURM_EXECUTION_ROLE_ARN'", "ThreadsPerCore": 1 }, { "InstanceGroupName": "'$COMPUTE_IG_NAME'", "InstanceType": "ml.c5.xlarge", "InstanceCount": 2, "LifeCycleConfig": { "SourceS3Uri": "s3://'$BUCKET_NAME'", "OnCreate": "on_create.sh" }, "ExecutionRole": "'$COMPUTE_NODE_ROLE'", "ThreadsPerCore": 1 }]'

    Se a execução for bem-sucedida, o comando exibirá o ARN do cluster da forma a seguir.

    { "ClusterArn": "arn:aws:sagemaker:us-east-1:111122223333:cluster/cluster_id" }
  2. (Opcional) Para verificar o status do seu cluster, você pode usar o console SageMaker AI (https://console.aws.amazon.com/sagemaker/). No painel de navegação à esquerda, escolha HyperPod Clusters e, em seguida, selecione Gerenciamento de Clusters. Escolha um nome de cluster para abrir a página de detalhes do cluster. Se seu cluster for criado com sucesso, você verá que o status do cluster é InService.

    Imagem mostrando um cluster HyperPod Slurm com vários nós controladores no console Amazon SageMaker AI.