Solução de problemas de atualizações do cluster AWS PCS - AWS PCS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solução de problemas de atualizações do cluster AWS PCS

Este tópico ajuda você a identificar e resolver problemas comuns que podem ocorrer ao atualizar as configurações do cluster.

Falha na atualização com erro de configuração contábil

Causa comum

O cluster entra no UPDATE_FAILED estado e a mensagem de erro indica um problema de configuração contábil. Isso geralmente ocorre quando a configuração contábil é incompatível com a versão atual do Slurm ou contém configurações inválidas.

Resolução

Revise suas configurações de contabilidade para verificar a compatibilidade com a versão do Slurm do seu cluster e envie uma solicitação de atualização corrigida com parâmetros de configuração válidos.

Falha na atualização com erro de configurações personalizadas

Causa comum

O cluster entra no UPDATE_FAILED estado e a mensagem de erro indica um problema nas configurações personalizadas do Slurm. Isso ocorre quando você fornece valores de parâmetros inválidos do Slurm ou combinações de parâmetros não suportadas.

Resolução

Valide suas configurações personalizadas do Slurm em relação aos parâmetros compatíveis e envie uma solicitação de atualização corrigida com valores e combinações de parâmetros válidos.

Não é possível enviar a solicitação de atualização

Causa comum

O botão de atualização está desativado no console ou a API retorna um erro de nível 400. Isso ocorre quando o cluster não está em um estado apropriado, os recursos associados não estão ativos ou há falhas de validação em sua configuração.

Resolução

Aguarde até que o cluster e todos os recursos associados atinjam o ACTIVE estado e, em seguida, revise sua configuração em busca de erros de validação antes de reenviar a solicitação de atualização.

Erros de validação

Causa comum

O comando retorna imediatamente com um erro HTTP de 400 níveis e uma mensagem descritiva. Isso ocorre devido ao estado do cluster, ao estado do recurso ou aos parâmetros de configuração inválidos.

Resolução

Solucione o erro de validação específico mencionado na resposta e repita a operação de atualização.