Configurações padrão de substituição de nós e proteção contra encerramento Como configurar a substituição de nós não íntegros ao iniciar um cluster Como configurar a substituição de nós não íntegros em um cluster em execução

Substituição de nós não íntegros pelo Amazon EMR

O Amazon EMR usa periodicamente o serviço de verificação de NodeManager saúde no Apache Hadoop para monitorar o status dos nós principais em seu Amazon EMR em clusters do Amazon EC2. Se um nó não estiver funcionando de maneira ideal, ele será marcado como não íntegro e o verificador de integridade reportará esse nó ao controlador Amazon EMR. O controlador do Amazon EMR adiciona o nó a uma lista de bloqueios, impedindo que o nó receba novas aplicações do YARN até que o status do nó melhore.

nota

Um motivo comum para um nó não estar íntegro é a falta de espaço em disco. Para obter mais informações sobre quando um nó central está quase sem espaço em disco, o seguinte artigo do Centro de conhecimento re:Post ajuda: Por que o nó central do meu cluster do Amazon EMR está ficando sem espaço em disco?

nota

O Hadoop fornece a capacidade de executar verificações personalizadas de integridade do nó. Isso é explicado com mais detalhes na documentação do Apache Hadoop em. NodeManager

Você pode escolher se o Amazon EMR deve encerrar os nós não íntegros ou mantê-los no cluster. Se você desativar a substituição de nós não íntegros, eles permanecerão na lista de rejeição e continuarão a ser considerados na capacidade do cluster. Você ainda pode se conectar à instância central do Amazon EC2 para configuração e recuperação a fim de redimensionar o cluster se quiser adicionar capacidade. Para obter mais informações sobre como a substituição e o encerramento de nós funcionam, consulte Usar proteção contra encerramento.

Se a substituição de nós com falha estiver ativada, o Amazon EMR encerrará um nó central com falha e provisionará uma nova instância, com base no número de instâncias no grupo de instâncias ou na capacidade alvo para frotas de instâncias. Se qualquer nó central se tornar não íntegro por mais de 45 minutos, o Amazon EMR o substituirá. Se a desativação gradual de um nó não for concluída em uma hora, o nó será encerrado à força, a menos que isso faça com que o cluster fique abaixo do fator de replicação ou das restrições de capacidade do HDFS.

Importante

Observe que o tempo necessário até que um nó seja descomissionado ou encerrado normalmente pode estar sujeito a alterações.

Embora a substituição inadequada de nós reduza significativamente a possibilidade de perda de dados, ela não elimina totalmente os riscos. Os dados do HDFS sejam perdidos permanentemente durante a substituição normal de uma instância central não íntegra. Recomendamos sempre fazer backup dos dados.

Para obter mais informações sobre como identificar e recuperar os nós não íntegros, consulte Resource errors. Além disso, para obter mais práticas recomendadas que você pode seguir para manter a integridade de um cluster, consulte a documentação a seguir sobre o erro de recurso O cluster do Amazon EMR termina com NO_SLAVE_LEFT e os nós centrais FAILED_BY_MASTER.

O Amazon EMR publica o CloudWatch Amazon Events para substituição de nós com problemas de integridade, para que você possa acompanhar o que está acontecendo com suas instâncias principais não íntegras. Para obter mais informações, consulte unhealthy node replacement events.

Configurações padrão de substituição de nós e proteção contra encerramento

A substituição de nós não íntegros está disponível em todas as versões do Amazon EMR, mas as configurações padrão dependem do rótulo de lançamento que você escolher. Você pode alterar qualquer uma dessas definições configurando a substituição de nós não íntegros ao criar um cluster ou acessando a configuração do cluster a qualquer momento.

Caso esteja criando um cluster de nó único ou de alta disponibilidade que esteja executando a versão 7.0 ou inferior do Amazon EMR, a configuração padrão de substituição de nós não íntegros depende da proteção contra encerramento:

Habilitar a proteção contra encerramento desabilita a substituição de nós não íntegros.
Desabilitar a proteção contra encerramento habilita a substituição de nós não íntegros.

Como configurar a substituição de nós não íntegros ao iniciar um cluster

Você pode ativar ou desativar a substituição não íntegra de nós ao iniciar um cluster usando o consoleAWS CLI, o ou a API.

A configuração padrão de substituição de nós não íntegros depende de como você inicia o cluster:

Console do Amazon EMR: a substituição de nós não íntegros é habilitada por padrão.
AWS CLIaws emr create-cluster— a substituição de nós não íntegros é ativada por padrão, a menos que você especifique--no-unhealthy-node-replacement.
Comando da RunJobFlow API do Amazon EMR — a substituição de nós não íntegros é ativada por padrão, a menos que você defina o valor UnhealthyNodeReplacement booleano como ou. True False

Console

Como ativar ou desativar a substituição de nós não íntegros ao criar um cluster usando o console

Faça login no Console de gerenciamento da AWS e abra o console do Amazon EMR em. https://console.aws.amazon.com/emr
Em EMR no EC2, no painel de navegação esquerdo, escolha Clusters e depois Criar cluster.
Em Versão de lançamento do EMR, escolha o rótulo de lançamento do Amazon EMR que deseja.
Em Encerramento de cluster e substituição de nó, verifique se a opção Substituição de nó não íntegro (recomendada) está pré-selecionada ou desmarque a seleção para desativá-la.
Escolha qualquer outra opção que se aplique ao cluster.
Para iniciar o cluster, escolha Criar cluster.

AWS CLI

Para ativar ou desativar a substituição de nós não íntegros ao criar um cluster usando oAWS CLI

Com oAWS CLI, você pode iniciar um cluster com a substituição de nós não íntegros ativada com o create-cluster comando com o --unhealthy-node-replacement parâmetro. A substituição de nós não íntegros está ativada por padrão.

O seguinte exemplo cria um cluster com a substituição de nós não íntegros habilitada:

nota
Os caracteres de continuação de linha do Linux (\) são incluídos para facilitar a leitura. Eles podem ser removidos ou usados em comandos do Linux. No Windows, remova-os ou substitua-os por um sinal de interpolação (^).
```
aws emr create-cluster --name "SampleCluster" --release-label emr-7.13.0 \
--applications Name=Hadoop Name=Hive Name=Pig \
--use-default-roles --ec2-attributes KeyName=myKey --instance-type m5.xlarge \
--instance-count 3 --unhealthy-node-replacement
```
Para obter mais informações sobre o uso dos comandos do Amazon EMR noAWS CLI, consulte Comandos do Amazon EMR. AWS CLI

Como configurar a substituição de nós não íntegros em um cluster em execução

Você pode ativar ou desativar a substituição de nós não íntegros em um cluster em execução usando o consoleAWS CLI, o ou a API.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Uso da proteção contra encerramento para proteger clusters do Amazon EMR do desligamento acidental

Trabalhar com AMIs

Substituição de nós não íntegros pelo Amazon EMR

nota

nota

Importante

Configurações padrão de substituição de nós e proteção contra encerramento

Como configurar a substituição de nós não íntegros ao iniciar um cluster

Como ativar ou desativar a substituição de nós não íntegros ao criar um cluster usando o console

Para ativar ou desativar a substituição de nós não íntegros ao criar um cluster usando oAWS CLI

nota

Como configurar a substituição de nós não íntegros em um cluster em execução

Para ativar ou desativar a substituição de nós não íntegros de um cluster em execução usando o console

Para ativar ou desativar a substituição de nós não íntegros em um cluster em execução usando oAWS CLI