Visão geral do Disponibilidade Parâmetros Considerações Histórico de recursos

Usar o ajuste de escala gerenciado no Amazon EMR

Importante

É altamente recomendável que você use a versão mais recente do Amazon EMR (Amazon EMR 7.13.0) para escalabilidade gerenciada. Em versões anteriores, você pode enfrentar falhas de aplicações intermitentes ou atrasos no ajuste de escala. O Amazon EMR resolveu esse problema nas versões 5.x: 5.30.2, 5.31.1, 5.32.1, 5.33.1 e posteriores, e nas versões 6.x: 6.1.1, 6.2.1, 6.3.1 e posteriores. Para ter mais informações sobre Regiões e disponibilidade de versões, consulte Disponibilidade gerenciada de ajuste de escala.

Visão geral do

Com o Amazon EMR 5.30.0 e versões posteriores (exceto para o Amazon EMR 6.0.0), você pode habilitar o Ajuste de Escala Gerenciado do Amazon EMR. Com o ajuste de escala gerenciado, é possível aumentar ou diminuir automaticamente o número de instâncias ou unidades no cluster com base na workload. O Amazon EMR avalia continuamente as métricas do cluster para tomar decisões de ajuste de escala que otimizam os clusters em termos de custo e velocidade. O ajuste de escala gerenciado está disponível para clusters compostos por grupos de instâncias ou frotas de instâncias.

Disponibilidade gerenciada de ajuste de escala

A seguir Regiões da AWS, a escalabilidade gerenciada do Amazon EMR está disponível com o Amazon EMR 6.14.0 e superior:
- Ásia-Pacífico (Taipei) (ap-east-2)
- Ásia-Pacífico (Melbourne) (ap-southeast-4)
- Ásia-Pacífico (Malásia) (ap-southeast-5)
- Ásia-Pacífico (Nova Zelândia) (ap-southeast-6)
- Ásia-Pacífico (Tailândia) (ap-southeast-7)
- Oeste do Canadá (Calgary) ca-west-1
- Europa (Espanha) (eu-south-2)
- México (Centro) (mx-central-1)
A seguir Regiões da AWS, a escalabilidade gerenciada do Amazon EMR está disponível com o Amazon EMR 5.30.0 e 6.1.0 ou superior:
- Leste dos EUA (Norte da Virgínia) (us-east-1)
- Leste dos EUA (Ohio) (us-east-2)
- Oeste dos EUA (Oregon) (us-west-2)
- Oeste dos EUA (Norte da Califórnia) (us-west-1)
- África (Cidade do Cabo) (af-south-1)
- Ásia-Pacífico (Hong Kong) (ap-east-1)
- Ásia-Pacífico (Mumbai) (ap-south-1)
- Ásia-Pacífico (Hyderabad) (ap-south-2)
- Ásia-Pacífico (Seul) (ap-northeast-2)
- Ásia-Pacífico (Singapura) (ap-southeast-1)
- Ásia-Pacífico (Sydney) (ap-southeast-2)
- Ásia-Pacífico (Jacarta) (ap-southeast-3)
- Ásia Pacific (Tóquio) (ap-northeast-1)
- Ásia-Pacífico (Osaka) (ap-northeast-3)
- Canadá (Central) (ca-central-1)
- América do Sul (São Paulo) (sa-east-1)
- Europa (Frankfurt) (eu-central-1)
- Europa (Zurique) (eu-central-2)
- Europa (Irlanda) (eu-west-1)
- Europa (Londres) (eu-west-2)
- UE (Milão) (eu-south-1)
- Europa (Paris) (eu-west-3)
- UE (Estocolmo) (eu-north-1)
- Israel (Tel Aviv) (il-central-1)
- Oriente Médio (EAU) (me-central-1)
- China (Pequim) (cn-north-1)
- China (Ningxia) (cn-northwest-1)
- AWS GovCloud (US-East) (us-gov-east-1)
- AWS GovCloud (US-West) (us-gov-west-1)
O Ajuste de Escala Gerenciado do Amazon EMR só funciona com aplicações YARN, como Spark, Hadoop, Hive e Flink. Não oferece suporte a aplicações que não sejam baseadas em YARN, como o Presto e HBase.

Parâmetros do ajuste de escala gerenciado

É necessário configurar os parâmetros a seguir para ajuste de escala gerenciado. O limite só se aplica aos nós core e de tarefa. Não é possível escalar o nó primário após a configuração inicial.

Mínimo (MinimumCapacityUnits): o limite inferior da capacidade permitida do EC2 em um cluster. É medido por meio de núcleos ou instâncias da unidade central de processamento virtual (vCPU) para grupos de instâncias. É medido por meio de unidades para frotas de instâncias.
Máximo (MaximumCapacityUnits): o limite superior da capacidade permitida do EC2 em um cluster. É medido por meio de núcleos ou instâncias da unidade central de processamento virtual (vCPU) para grupos de instâncias. É medido por meio de unidades para frotas de instâncias.
On-Demand limit (MaximumOnDemandCapacityUnits) (Opcional) — O limite superior da capacidade permitida do EC2 para o tipo de On-Demand mercado em um cluster. Se este parâmetro não for especificado, o valor MaximumCapacityUnits será usado como padrão.
- Esse parâmetro é usado para dividir a alocação de capacidade entre instâncias spot On-Demand e instâncias spot. Por exemplo, se você definir o parâmetro mínimo como 2 instâncias, o parâmetro máximo como 100 instâncias e o On-Demand limite como 10 instâncias, a escalabilidade gerenciada do Amazon EMR aumenta para até 10 On-Demand instâncias e aloca a capacidade restante para instâncias spot. Para obter mais informações, consulte Cenários de alocação de nós.
Máximo de nós centrais (MaximumCoreCapacityUnits) (opcional): o limite superior da capacidade permitida do EC2 para o tipo de nó central em um cluster. Se este parâmetro não for especificado, o valor MaximumCapacityUnits será usado como padrão.
- Esse parâmetro é usado para dividir a alocação de capacidade entre nós de centrais e de tarefa. Por exemplo, se você definir o parâmetro mínimo como duas instâncias, o máximo como cem instâncias e o nó central máximo como 17 instâncias, o Ajuste de Escala Gerenciado do Amazon EMR escalará até 17 nós principais e alocará as 83 instâncias restantes aos nós de tarefa. Para obter mais informações, consulte Cenários de alocação de nós.

Para obter mais informações sobre parâmetros de ajuste de escala gerenciado, consulte ComputeLimits.

Considerações sobre Ajuste de Escala Gerenciado do Amazon EMR

A escalabilidade gerenciada é suportada em versões limitadas Regiões da AWS e do Amazon EMR. Para obter mais informações, consulte Disponibilidade gerenciada de ajuste de escala.
Você deve configurar os parâmetros necessários para o Ajuste de Escala Gerenciado do Amazon EMR. Para obter mais informações, consulte Parâmetros do ajuste de escala gerenciado.
Para usar o ajuste de escala gerenciado, o processo coletor de métricas deve ser capaz de se conectar ao endpoint público da API para o ajuste de escala gerenciado no API Gateway. Se você usar um nome DNS privado com Amazon Virtual Private Cloud, o escalonamento gerenciado não funcionará corretamente. Para garantir que o ajuste de escala gerenciado funcione, é recomendável executar uma das seguintes ações:
- Remova o endpoint da VPC de interface do API Gateway da Amazon VPC.
- Siga as instruções em Por que ocorre um erro HTTP 403 Proibido ao conectar APIs do API Gateway de uma VPC? para desabilitar a configuração de nome DNS privado.
- Em vez disso, inicie o cluster em sua sub-rede privada. Para obter mais informações, consulte o tópico em Sub-redes privadas.
Se os trabalhos do YARN ficarem intermitentemente lentos durante a redução da escala verticalmente e os logs do YARN Resource Manager mostrarem que a maioria dos nós foram listados como negados durante o período, você poderá ajustar o limite do tempo limite de desativação.

Reduza spark.blacklist.decommissioning.timeout de uma hora para um minuto para disponibilizar o nó para que outros contêineres pendentes continuem o processamento de tarefa.

Defina também YARN.resourcemanager.nodemanager-graceful-decommission-timeout-secs como um valor maior para garantir que o Amazon EMR não force o término do nó enquanto a “Tarefa do Spark” mais longa ainda estiver em execução no nó. O padrão atual é 60 minutos, o que significa que o YARN força o término do contêiner após 60 minutos, quando o nó entra no estado de desativação.

O exemplo a seguir da linha de log do YARN Resource Manager mostra os nós adicionados ao estado de desativação:
```
2021-10-20 15:55:26,994 INFO org.apache.hadoop.YARN.server.resourcemanager.DefaultAMSProcessor (IPC Server handler 37 on default port 8030): blacklist are updated in Scheduler.blacklistAdditions: [ip-10-10-27-207.us-west-2.compute.internal, ip-10-10-29-216.us-west-2.compute.internal, ip-10-10-31-13.us-west-2.compute.internal, ... , ip-10-10-30-77.us-west-2.compute.internal], blacklistRemovals: []
```
Veja mais detalhes sobre como o Amazon EMR se integra à lista de negação do YARN durante o desativação de nós, casos em que nós no Amazon EMR podem ser listados como negados e como configurar o comportamento de desativação de nós do Spark.
Para cargas de trabalho do Spark, desabilitar o Spark Dynamic Resource Allocator (DRA) alterando a propriedade spark.dynamic do Spark Allocation.enabled para FALSE pode causar problemas de escalabilidade gerenciada, em que os clusters podem ser ampliados mais do que o necessário para suas cargas de trabalho (até a computação máxima). Ao usar o ajuste de escala gerenciado para essas workloads, recomendamos que você mantenha o Spark DRA habilitado, que é o estado padrão dessa propriedade.
Over-utilization dos volumes do EBS podem causar problemas de escalabilidade gerenciada. É recomendável manter o volume do EBS abaixo de 90% de utilização. Para obter mais informações, consulte Opções e comportamento de armazenamento de instâncias no Amazon EMR.
CloudWatch As métricas da Amazon são essenciais para a operação da escalabilidade gerenciada do Amazon EMR. Recomendamos que você monitore de perto CloudWatch as métricas da Amazon para garantir que os dados não estejam ausentes. Para obter mais informações sobre como você pode configurar CloudWatch alarmes para detectar métricas ausentes, consulte Usando CloudWatch alarmes da Amazon.
As operações de ajuste de escala gerenciado nos clusters das versões 5.30.0 e 5.30.1 sem o Presto instalado podem causar falhas na aplicação ou fazer com que um grupo de instâncias ou uma frota de instâncias uniforme permaneça no estado ARRESTED, sobretudo quando uma operação de redução da escala verticalmente logo é seguida por uma operação de aumento da escala verticalmente.

Como solução alternativa, escolha o Presto como uma aplicação a ser instalada ao criar um cluster com as versões 5.30.0 e 5.30.1 do Amazon EMR, mesmo que o trabalho não exija o Presto.
Ao definir o nó principal máximo e o On-Demand limite para a escalabilidade gerenciada do Amazon EMR, considere as diferenças entre grupos de instâncias e frotas de instâncias. Cada grupo de instâncias consiste no mesmo tipo de instância e na mesma opção de compra para instâncias: On-Demand ou Spot. Para cada frota de instâncias, você pode especificar até cinco tipos de instância, que podem ser provisionados como On-Demand instâncias spot. Para obter mais informações, consulte Create a cluster with instance fleets or uniform instance groups, Instance fleet options e Cenários de alocação de nós.
Com o Amazon EMR 5.30.0 e versões posteriores, ao remover a regra de saída Permitir tudo padrão para 0.0.0.0/ para o grupo de segurança principal, você deverá adicionar uma regra que permita a conectividade TCP de saída ao grupo de segurança para acesso ao serviço na porta 9443. O grupo de segurança para acesso ao serviço também deve permitir tráfego TCP de entrada na porta 9443 do grupo de segurança principal. Para obter mais informações sobre a configuração de grupos de segurança, consulte Grupo EMR-managed de segurança da Amazon para a instância primária (sub-redes privadas).
Você pode usar AWS CloudFormation para configurar a escalabilidade gerenciada do Amazon EMR. Para obter mais informações, consulte AWS::EMR::Cluster, no Guia do usuário do AWS CloudFormation .
Caso esteja usando nós spot, considere usar rótulos de nós para evitar que o Amazon EMR remova processos de aplicações quando o Amazon EMR remover nós spot. Para obter mais informações sobre rótulos de nós, consulte Task nodes.
Por padrão, a rotulagem de nós não é compatível com as versões 6.15 ou inferiores do Amazon EMR. Para obter mais informações, consulte Understand node types: primary, core, and task nodes.
Caso esteja usando as versões 6.15 ou inferiores do Amazon EMR, só poderá atribuir rótulos de nós por tipo de nó, como nós centrais e de tarefa. No entanto, se você estiver usando o Amazon EMR versão 7.0 ou superior, poderá configurar rótulos de nós por tipo de nó e tipo de mercado, como On-Demand Spot.
Se a demanda do processo da aplicação aumentar e a demanda do executor diminuir ao restringir o processo da aplicação aos nós centrais, você poderá adicionar novamente os nós centrais e remover os nós de tarefa na mesma operação de redimensionamento. Para obter mais informações, consulte Understanding node allocation strategy and scenarios.
O Amazon EMR não rotula os nós de tarefas, então você não pode definir as propriedades do YARN para restringir os processos da aplicação somente para nós de tarefas. No entanto, caso queira usar tipos de mercado como rótulos de nós, poderá usar os rótulos ON_DEMAND ou SPOT para o posicionamento do processo da aplicação. Não recomendamos usar nós spot nos processos primários da aplicação.
Ao usar rótulos de nós, o total de unidades em execução no cluster pode exceder temporariamente a computação máxima definida na sua política de ajuste de escala gerenciado, enquanto o Amazon EMR desativa algumas de suas instâncias. O total de unidades solicitadas sempre permanecerá igual ou abaixo da computação máxima da política.
O ajuste de escala gerenciado é compatível apenas com os rótulos dos nós ON_DEMAND e SPOT ou CORE e TASK. Não há suporte para rótulos de nós personalizados.
O Amazon EMR cria rótulos de nós ao criar o cluster e provisionar recursos. O Amazon EMR não oferece suporte à adição de rótulos de nós ao reconfigurar o cluster. Você também não pode modificar os rótulos dos nós ao configurar o ajuste de escala gerenciado após executar o cluster.
O ajuste de escala gerenciado dimensiona os nós centrais e de tarefas de forma independente, com base no processo da aplicação e na demanda do executor. Para evitar problemas de perda de dados do HDFS durante a redução vertical da escala central, siga a prática padrão para os nós centrais. Para saber mais sobre as práticas recomendadas para nós centrais e replicação do HDFS, consulte Considerations and best practices.
Você não pode colocar o processo da aplicação e os executores somente no nó core ou ON_DEMAND. Caso queira adicionar o processo da aplicação e os executores em um dos nós, não use a configuração yarn.node-labels.am.default-node-label-expression.

Por exemplo, para colocar o processo da aplicação e os executores em nós ON_DEMAND, defina a computação máxima como a máxima no nó ON_DEMAND. Remova também a configuração yarn.node-labels.am.default-node-label-expression.

Para adicionar o processo da aplicação e os executores nos nós core, remova a configuração yarn.node-labels.am.default-node-label-expression.
Ao usar o ajuste de escala gerenciado com rótulos de nós, defina a propriedade yarn.scheduler.capacity.maximum-am-resource-percent: 1 se planeja executar várias aplicações em paralelo. Isso garante que os processos da aplicação utilizem totalmente os nós CORE ou ON_DEMAND disponíveis.
Caso use ajuste de escala gerenciado com rótulos de nós, defina a propriedade yarn.resourcemanager.decommissioning.timeout para um valor maior do que a aplicação de execução mais longa no cluster. Isso reduz a chance de o ajuste de escala gerenciado do Amazon EMR precisar reprogramar suas aplicações para desativar nós CORE ou ON_DEMAND.
Para reduzir o risco de falhas na aplicação devido à perda de dados de shuffle, o Amazon EMR coleta métricas do cluster para determinar os nós que têm dados aleatórios transitórios existentes do estágio atual e do anterior. Em casos raros, as métricas podem continuar relatando dados obsoletos de aplicações que já foram concluídas ou encerradas. Isso pode afetar a redução oportuna da escala vertical das instâncias no seu cluster. Para clusters com grandes quantidades de dados de shuffle, considere usar as versões 6.13 e posteriores do EMR.

Histórico de recursos

Esta tabela lista as atualizações na funcionalidade de ajuste de escala gerenciado do Amazon EMR.

Data de lançamento	Recurso	Versões do Amazon EMR
20 de novembro de 2024	O ajuste de escala gerenciado está disponível nas regiões `il-central-1` Israel (Tel Aviv), `me-central-1` Oriente Médio (Emirados Árabes Unidos) e `ap-northeast-3` Ásia-Pacífico (Osaka).	5.30.0, 6.1.0 e superiores
15 de novembro de 2024	O ajuste de escala gerenciado está disponível na região `eu-central-2` Europa (Zurique).	5.30.0, 6.1.0 e superiores
20 de agosto de 2024	Os rótulos de nós já estão disponíveis no ajuste de escala gerenciado, para que você possa rotular instâncias com base no tipo de mercado ou de nó para melhorar o ajuste de escala automático.	Versão 7.2.0 e posterior
31 de março de 2024	O ajuste de escala gerenciado está disponível na região `ap-south-2` Ásia-Pacífico (Hyderabad).	6.14.0 e posterior
13 de fevereiro de 2024	O ajuste de escala gerenciado está disponível na região `eu-south-2` Europa (Espanha).	6.14.0 e posterior
10 de outubro de 2023	Ajuste de Escala Gerenciado disponível na região `ap-southeast-3` Ásia-Pacífico (Jacarta).	6.14.0 e posterior
28 de julho de 2023	O ajuste de escala gerenciado foi aprimorado para alternar para um grupo de instâncias de tarefa diferente ao aumentar a escala verticalmente quando o Amazon EMR sofre um atraso ao aumentar a escala verticalmente com o grupo de instâncias atual.	5.34.0 e posteriores, 6.4.0 e posteriores
16 de junho de 2023	O ajuste de escala gerenciado foi aprimorado para reconhecer os nós que executam a aplicação principal, de forma que esses nós não sejam reduzidos. Para obter mais informações, consulte Noções básicas da estratégia e dos cenários de alocação de nós do Amazon EMR.	5.34.0 e posteriores, 6.4.0 e posteriores
21 de março de 2022	Foi adicionado o reconhecimento de dados de shuffle do Spark usado ao reduzir a escala verticalmente de clusters. Para clusters do Amazon EMR com o Apache Spark e o atributo de ajuste de escala gerenciado habilitado, o Amazon EMR monitora continuamente os executores do Spark e os locais intermediários de dados de shuffle. Com essas informações, o Amazon EMR reduz a escala verticalmente apenas das instâncias subutilizadas que não contêm dados de shuffle usados ativamente. Isso evita o recálculo de dados de shuffle perdidos, ajudando a reduzir custos e melhorar a performance do trabalho. Para obter mais informações, consulte o Spark Programming Guide.	5.34.0 e posteriores, 6.4.0 e posteriores

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Use o ajuste de escala de cluster do Amazon EMR para se ajustar às mudanças nas workloads

Configurar o ajuste de escala gerenciado