As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Criando um cluster com um externo Slurmdbd contabilidade
Saiba como configurar e criar um cluster com contabilidade do Slurmdbd externa. Para obter mais informações, consulte Slurmcontabilidade com AWS ParallelCluster.
Ao usar a interface de linha de AWS ParallelCluster comando (CLI) ou a API, você paga apenas pelos AWS recursos criados ao criar ou atualizar AWS ParallelCluster imagens e clusters. Para obter mais informações, consulte AWS serviços usados por AWS ParallelCluster.
A AWS ParallelCluster interface do usuário é construída em uma arquitetura sem servidor e você pode usá-la dentro da AWS Free Tier categoria na maioria dos casos. Para ter mais informações, consulte AWS ParallelCluster UI costs.
Neste tutorial, você usa um modelo de AWS CloudFormation criação rápida para criar os componentes necessários para implantar uma instância do Slurmdbd na mesma VPC do cluster. O modelo cria uma configuração básica de rede e segurança para a conexão entre o cluster e o banco de dados.
nota
Começando comversion 3.10.0, AWS ParallelCluster oferece suporte ao Slurmdbd externo com o parâmetro de configuração do cluster. SlurmSettings / ExternelSlurmdbd
nota
O modelo de criação rápida serve como exemplo. Esse modelo não abrange todos os casos de uso possíveis. É sua responsabilidade criar um Slurmdbd externo com a configuração e capacidade apropriadas para seus workloads de produção.
Pré-requisitos:
-
AWS ParallelCluster está instalado.
-
O AWS CLI está instalado e configurado.
-
Você tem um par de chaves do Amazon Elastic Compute Cloud.
-
Você tem uma AWS Identity and Access Management função com as permissões necessárias para executar a pcluster CLI.
-
Você tem um banco de dados de contabilidade do Slurm. Para seguir um tutorial sobre como criar o banco de dados de contabilidade do Slurm, siga as etapas 1 e 2 em Criar a pilha do banco de dados contabilidade do Slurm.
Etapa 1: criar a pilha do Slurmdbd
Neste tutorial, use um modelo de CloudFormation criação rápida (us-east-1) para criar
Redes
-
VPCId: o ID da VPC para iniciar a instância do Slurmdbd.
-
SubnetId: o ID da sub-rede para iniciar a instância do Slurmdbd.
-
PrivatePrefix: o prefixo CIDR da VPC.
-
PrivateIp: um IP privado secundário a ser atribuído à instância do Slurmdbd.
Conexão de banco de dados
-
DBMSClientSG: O grupo de segurança a ser anexado à instância do Slurmdbd. Esse grupo de segurança deve permitir conexões entre o servidor do banco de dados e a instância do Slurmdbd.
-
DBMSDatabaseName: O nome do banco de dados.
-
DBMSUsername: o nome de usuário do banco de dados.
-
DBMSPasswordSecretArn: O segredo que contém a senha do banco de dados.
-
DBMSUri: o URI do servidor de banco de dados.
Configurações das instâncias
-
InstanceType: um tipo de instância a ser usado para a instância slurmdbd.
-
KeyName: um par de chaves do Amazon EC2 para usar na instância slurmdbd.
Configurações do Slurmdbd
-
AMIID: uma AMI da instância do Slurmdbd. A AMI deve ser uma ParallelCluster AMI. A versão da ParallelCluster AMI determina a versão do Slurmdbd.
-
MungeKeySecretArn: o segredo que contém a chave munge a ser usada para autenticar as comunicações entre o Slurmdbd e os clusters.
-
SlurmdbdPort: um número de porta que o slurmdbd usa.
-
EnableSlurmdbdSystemService: ativa o slurmdbd como serviço do sistema e o executa quando uma instância é iniciada.
Atenção
Se o banco de dados foi criado por uma versão diferente do SlurmDB, não use o Slurmdbd como um serviço do sistema.
Se o banco de dados contiver um grande número de entradas, o Slurm Database Daemon (SlurmDBD) poderá levar dezenas de minutos para atualizar o banco de dados e ficar sem resposta durante esse intervalo de tempo.
Antes de atualizar o SlurmDB, faça um backup do banco de dados. Para obter mais informações, consulte a documentação do Slurm
Etapa 2: criar um cluster com recursos externos Slurmdbd habilitado
O CloudFormation modelo fornecido gera uma CloudFormation pilha com algumas saídas definidas.
Em Console de gerenciamento da AWS, visualize a guia Saídas na CloudFormation pilha para revisar as entidades criadas. Para habilitar a Slurm contabilização, algumas dessas saídas devem ser usadas no AWS ParallelCluster arquivo de configuração:
-
SlurmdbdPrivateIp: usado para o parâmetro de configuração do cluster SlurmSettingsExternalSlurmdbd//Host.
-
SlurmdbdPort: usado para o valor do parâmetro de configuração do cluster SlurmSettings ExternalSlurmdbd//Port.
-
AccountingClientSecurityGroup: esse é o grupo de segurança anexado ao nó principal do cluster definido no parâmetro HeadNode/Networking/AdditionalSecurityGroupsconfiguration.
Além disso, na guia Parâmetros na visualização da CloudFormation pilha:
-
MungeKeySecretArn: usado para o valor do SlurmSettingsparâmetro de configuração do MungeKeySecretArncluster/.
Atualize os parâmetros do banco de dados do arquivo de configuração do cluster com os valores de saída. Use o pcluster AWS CLI para criar o cluster.
$pcluster create-cluster -ncluster-3.x-cpath/to/cluster-config.yaml
Depois que o cluster for criado, você poderá começar a usar comandos de contabilidade Slurm, como sacctmgr ou sacct.
Atenção
O tráfego entre o ParallelCluster e o SlurmDB externo não é criptografado. É recomendável executar o cluster e o SlurmDB externo em uma rede confiável.