As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usando o PCS-ready DLAMI com AWS PCS
A AWS PCS-ready DLAMI Base GPU AMI (Ubuntu 24.04) é AWS-maintained uma imagem de máquina da Amazon AI/ML para execução e cargas de trabalho de HPC em PCS. AWS Ele fornece uma base pronta para produção para que você possa implantar clusters em minutos, em vez de criar e validar AMIs personalizadas.
O que está incluído
PCS-ready O DLAMI é baseado na AMI de GPU Base de Aprendizado Profundo (Ubuntu 24.04) e adiciona os seguintes componentes do PCS: AWS
Agente PCS — O agente de gerenciamento de cluster AWS PCS
Slurm para AWS PCS — Várias versões suportadas do Slurm estão pré-instaladas. A versão correta é ativada automaticamente durante a execução da instância com base na configuração do seu cluster.
Utilitários EFS — Para montar sistemas de arquivos Amazon EFS
A fonte DLAMI fornece o sistema operacional (Ubuntu 24.04), drivers de GPU NVIDIA, kit de ferramentas CUDA, drivers EFA, cliente Lustre e outras infraestruturas básicas. Para obter detalhes sobre esses componentes, consulte as notas de versão da AMI de aprendizado profundo.
PCS-ready O DLAMI está disponível para as arquiteturas x86_64 e arm64.
nota
PCS-ready O DLAMI não inclui software aplicativo, AI/ML como estruturas PyTorch (,, JAX) TensorFlow, compiladores ou bibliotecas matemáticas. Você pode adicionar sua camada de aplicativo em sistemas de arquivos compartilhados ou criando uma AMI personalizada sobre a PCS-ready DLAMI.
Cada campo Descrição da AMI resume seu conteúdo, incluindo a DLAMI de origem na qual se baseia, a versão do PCS Agent, as versões suportadas do Slurm e a versão dos utilitários do EFS. Você pode visualizar esse campo no console do Amazon EC2 ou usando a describe-images API. Veja a seguir um exemplo de um valor de campo Descrição:
PCS-Ready DLAMI based on Deep Learning Base OSS Nvidia Driver GPU AMI (Ubuntu 24.04) 20260522. PCS Agent: 1.4.0-1. Slurm: 24.11.7-1, 25.05.7-1, 25.11.2-1. EFS Utils: 2.4.2
Encontre o PCS-ready DLAMI atual
Use com infraestrutura como código
O caminho do parâmetro SSM fornece uma referência estável que sempre se resolve para a ID da AMI mais recente. Você pode usar isso em CloudFormation modelos para obter automaticamente novas versões na reimplantação:
AmiId: '{{resolve:ssm:/aws/service/pcs/ami/dlami-base-ubuntu2404/x86_64/latest/ami-id}}'
Atualize para uma nova versão
A AWS lança versões atualizadas do PCS-ready DLAMI quando a GPU AMI de origem do Deep Learning Base é atualizada ou quando os componentes do PCS (PCS Agent ou Slurm for PCS) são atualizados. Para atualizar seu cluster, recupere a ID da AMI mais recente usando o parâmetro SSM ou a pesquisa de nome descrita acima e, em seguida, atualize cada grupo de nós de computação para fazer referência à nova ID da AMI.