Criação de SageMaker HyperPod clusters usando CloudFormation modelos - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de SageMaker HyperPod clusters usando CloudFormation modelos

Você pode criar SageMaker HyperPod clusters usando os CloudFormation modelos para HyperPod. Você deve instalar AWS CLI para continuar.

Configure recursos no console e implante usando CloudFormation

Você pode configurar recursos usando o Console de gerenciamento da AWS e implantar usando os CloudFormation modelos.

Siga estas etapas.

  1. Em vez de escolher Enviar, escolha Baixar parâmetros do CloudFormation modelo no final do tutorial emIntrodução ao SageMaker HyperPod uso do console de SageMaker IA. O tutorial contém informações de configuração importantes das quais você precisará para criar o cluster com êxito.

    Importante

    Se você escolher Enviar, não poderá implantar um cluster com o mesmo nome enquanto não excluir o cluster.

    Depois de escolher Baixar parâmetros do CloudFormation modelo, a janela Usando o arquivo de configuração para criar o cluster usando a AWS CLI janela aparecerá no lado direito da página.

  2. Na janela Usar o arquivo de configuração para criar o cluster usando a AWS CLI, escolha Baixar arquivo de parâmetros de configuração. O arquivo será baixado na sua máquina. Você pode editar o arquivo JSON de configuração com base nas suas necessidades ou deixá-lo como está, se nenhuma alteração for necessária.

  3. Em um terminal, navegue até o local do arquivo de parâmetro file://params.json.

  4. Execute o AWS CLI comando create-stack para implantar a CloudFormation pilha que provisionará os recursos configurados e criará o cluster. HyperPod

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. Para ver o status do provisionamento de recursos, navegue até o CloudFormation console.

    Depois que a criação do cluster for concluída, visualize o novo cluster em Clusters no painel principal do SageMaker HyperPod console. Você pode conferir o status exibido na coluna Status.

  6. Depois que o status do cluster mudar para InService, você poderá começar a fazer login nos nós do cluster. Para acessar os nós do cluster e começar a executar workloads de ML, consulte Trabalhos em SageMaker HyperPod clusters.

Configure e implante recursos usando CloudFormation

Você pode configurar e implantar recursos usando os CloudFormation modelos do SageMaker HyperPod.

Siga estas etapas.

  1. Baixe um CloudFormation modelo para SageMaker HyperPod do sagemaker-hyperpod-cluster-setup GitHub repositório.

  2. Execute o AWS CLI comando create-stack para implantar a CloudFormation pilha que provisionará os recursos configurados e criará o cluster. HyperPod

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. Para ver o status do provisionamento de recursos, navegue até o console do CloudFormation .

    Depois que a criação do cluster for concluída, visualize o novo cluster em Clusters no painel principal do SageMaker HyperPod console. Você pode conferir o status exibido na coluna Status.

  4. Depois que o status do cluster mudar para InService, você poderá começar a fazer login nos nós do cluster.