As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Substituição de nós não íntegros pelo Amazon EMR
O Amazon EMR usa periodicamente o serviço de verificação de NodeManager saúde
nota
Um motivo comum para um nó não estar íntegro é a falta de espaço em disco. Para obter mais informações sobre quando um nó principal está quase sem espaço em disco, o seguinte artigo do re:POST Knowledge Center é útil: Por que o nó principal do meu cluster do Amazon EMR está ficando sem espaço em
nota
O Hadoop fornece a capacidade de executar verificações personalizadas de integridade dos nós. Isso é explicado com mais detalhes na documentação do Apache Hadoop em. NodeManager
Você pode escolher se o Amazon EMR deve encerrar os nós não íntegros ou mantê-los no cluster. Se você desativar a substituição de nós não saudáveis, eles permanecerão na lista de negação e continuarão contando para a capacidade do cluster. Você ainda pode se conectar à sua instância EC2 principal da Amazon para configuração e recuperação, então você pode redimensionar seu cluster se quiser adicionar capacidade. Para obter mais informações sobre como a substituição e o encerramento de nós funcionam, consulte Usando a proteção contra encerramento.
Se a substituição de nós não íntegros for ativada, o Amazon EMR encerra um nó principal não íntegro e provisiona uma nova instância, com base no número de instâncias no grupo de instâncias ou com base na capacidade alvo das frotas de instâncias. Se algum nó ficar insalubre por mais de 45 minutos, o Amazon EMR substituirá os nós normalmente. Se o descomissionamento normal de um nó não for concluído em uma hora, o nó será encerrado à força, a menos que o encerramento faça com que o cluster fique abaixo do fator de replicação ou das restrições de capacidade do HDFS.
Importante
Observe que o tempo necessário até que um nó seja descomissionado ou encerrado normalmente pode estar sujeito a alterações.
Embora a substituição inadequada de nós reduza significativamente a possibilidade de perda de dados, ela não elimina totalmente o risco. Os dados do HDFS podem ser perdidos permanentemente durante a substituição normal de uma instância central não íntegra. Recomendamos que você sempre faça backup de seus dados.
Para obter mais informações sobre como identificar e recuperar os nós não íntegros, consulte Resource errors. Além disso, para obter mais práticas recomendadas que você pode seguir para manter a integridade de um cluster, consulte a documentação a seguir sobre o erro de recurso O cluster do Amazon EMR termina com NO_SLAVE_LEFT e os nós principais FAILED_BY_MASTER.
O Amazon EMR publica o CloudWatch Amazon Events para substituição de nós com problemas de integridade, para que você possa acompanhar o que está acontecendo com suas instâncias principais não íntegras. Para obter mais informações, consulte unhealthy node replacement events.
Configurações padrão de substituição de nós e proteção contra encerramento
A substituição de nós não íntegros está disponível em todas as versões do Amazon EMR, mas as configurações padrão dependem do rótulo de lançamento que você escolher. Você pode alterar qualquer uma dessas definições configurando a substituição de nós não íntegros ao criar um cluster ou acessando a configuração do cluster a qualquer momento.
Caso esteja criando um cluster de nó único ou de alta disponibilidade que esteja executando a versão 7.0 ou inferior do Amazon EMR, a configuração padrão de substituição de nós não íntegros depende da proteção contra encerramento:
Habilitar a proteção contra encerramento desabilita a substituição de nós não íntegros.
Desabilitar a proteção contra encerramento habilita a substituição de nós não íntegros.
Como configurar a substituição de nós não íntegros ao iniciar um cluster
Você pode ativar ou desativar a substituição não íntegra de nós ao iniciar um cluster usando o console AWS CLI, o ou a API.
A configuração padrão de substituição de nós não íntegros depende de como você inicia o cluster:
-
Console do Amazon EMR: a substituição de nós não íntegros é habilitada por padrão.
-
AWS CLI
aws emr create-cluster
— a substituição de nós não íntegros é ativada por padrão, a menos que você especifique--no-unhealthy-node-replacement
. -
Comando da RunJobFlow API do Amazon EMR — a substituição de nós não íntegros é ativada por padrão, a menos que você defina o valor
UnhealthyNodeReplacement
booleano como ou.True
False
Como configurar a substituição de nós não íntegros em um cluster em execução
Você pode ativar ou desativar a substituição de nós não íntegros em um cluster em execução usando o console AWS CLI, o ou a API.