View a markdown version of this page

Usando o PCS-ready DLAMI com AWS PCS - AWS PCS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando o PCS-ready DLAMI com AWS PCS

A AWS PCS-ready DLAMI Base GPU AMI (Ubuntu 24.04) é AWS-maintained uma imagem de máquina da Amazon AI/ML para execução e cargas de trabalho de HPC em PCS. AWS Ele fornece uma base pronta para produção para que você possa implantar clusters em minutos, em vez de criar e validar AMIs personalizadas.

O que está incluído

PCS-ready O DLAMI é baseado na AMI de GPU Base de Aprendizado Profundo (Ubuntu 24.04) e adiciona os seguintes componentes do PCS: AWS

  • Agente PCS — O agente de gerenciamento de cluster AWS PCS

  • Slurm para AWS PCS — Várias versões suportadas do Slurm estão pré-instaladas. A versão correta é ativada automaticamente durante a execução da instância com base na configuração do seu cluster.

  • Utilitários EFS — Para montar sistemas de arquivos Amazon EFS

A fonte DLAMI fornece o sistema operacional (Ubuntu 24.04), drivers de GPU NVIDIA, kit de ferramentas CUDA, drivers EFA, cliente Lustre e outras infraestruturas básicas. Para obter detalhes sobre esses componentes, consulte as notas de versão da AMI de aprendizado profundo.

PCS-ready O DLAMI está disponível para as arquiteturas x86_64 e arm64.

nota

PCS-ready O DLAMI não inclui software aplicativo, AI/ML como estruturas PyTorch (,, JAX) TensorFlow, compiladores ou bibliotecas matemáticas. Você pode adicionar sua camada de aplicativo em sistemas de arquivos compartilhados ou criando uma AMI personalizada sobre a PCS-ready DLAMI.

Cada campo Descrição da AMI resume seu conteúdo, incluindo a DLAMI de origem na qual se baseia, a versão do PCS Agent, as versões suportadas do Slurm e a versão dos utilitários do EFS. Você pode visualizar esse campo no console do Amazon EC2 ou usando a describe-images API. Veja a seguir um exemplo de um valor de campo Descrição:

PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2

Encontre o PCS-ready DLAMI atual

Console de gerenciamento da AWS
Para encontrar o PCS-ready DLAMI no console
  1. Abra o console AWS PCS e navegue para criar ou editar um grupo de nós de computação.

  2. Na seção Seleção de AMI, selecione PCS-ready AMIs.

  3. Uma lista suspensa é exibida mostrando os PCS-ready DLAMis disponíveis filtrados pela arquitetura do tipo de instância selecionado.

  4. Escolha AWS PCS-ready DLAMI Base AMI (Ubuntu 24.04). O menu suspenso exibe o ID da AMI e o nome completo da AMI abaixo para referência.

AWS CLI

Você pode recuperar a ID de AMI PCS-ready DLAMI mais recente usando o Amazon EC2 Systems Manager Parameter Store. region-codeSubstitua pelo seu Região da AWS.

  • x86_64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id \ --query "Parameter.Value" --output text
  • arm64

    aws ssm get-parameter --region region-code \ --name /aws/service/pcs/ami/dlami-base-ubuntu2404/arm64/latest/ami-id \ --query "Parameter.Value" --output text

Como alternativa, você pode pesquisar PCS-ready DLAMI por padrão de nome:

  • x86_64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-x86_64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text
  • arm64

    aws ec2 describe-images --region region-code --owners amazon \ --filters 'Name=name,Values=aws-pcs-ready-dlami-base-ubuntu2404-arm64-*' \ 'Name=state,Values=available' \ --query 'sort_by(Images, &CreationDate)[-1].[Name,ImageId]' --output text

Use o ID da AMI ao criar ou atualizar um grupo de nós de computação.

Use com infraestrutura como código

O caminho do parâmetro SSM fornece uma referência estável que sempre se resolve para a ID da AMI mais recente. Você pode usar isso em CloudFormation modelos para obter automaticamente novas versões na reimplantação:

AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'

Atualize para uma nova versão

A AWS lança versões atualizadas do PCS-ready DLAMI quando a GPU AMI de origem do Deep Learning Base é atualizada ou quando os componentes do PCS (PCS Agent ou Slurm for PCS) são atualizados. Para atualizar seu cluster, recupere a ID da AMI mais recente usando o parâmetro SSM ou a pesquisa de nome descrita acima e, em seguida, atualize cada grupo de nós de computação para fazer referência à nova ID da AMI.