Políticas de Auto Scaling - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Políticas de Auto Scaling

Uma política de escalabilidade tem os seguintes componentes:

  • Uma métrica alvo — A CloudWatch métrica que ElastiCache o Valkey e o Redis OSS Auto Scaling usa para determinar quando e quanto escalar.

  • Capacidade mínima e máxima: o número mínimo e máximo de fragmentos a ser usado para a escalabilidade.

    Importante

    Ao criar a política de Auto Scaling, se a capacidade atual for maior que a capacidade máxima configurada, escalamos para a MaxCapacity durante a criação da política. Da mesma forma, se a capacidade atual for menor que a capacidade mínima configurada, escalamos para o. MinCapacity

  • Um período de desaquecimento: a quantidade de tempo, em segundos, que outra ação de aumento ou redução de escala na horizontal deve aguardar antes de ser iniciada, após a conclusão de uma ação de expansão ou redução.

  • Uma função vinculada ao serviço — uma função do AWS Identity and Access Management (IAM) vinculada a um serviço específico. AWS Uma função vinculada ao serviço inclui todas as permissões que o serviço exige para chamar outros AWS serviços em seu nome. ElastiCache O Auto Scaling gera automaticamente essa função para AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG você.

  • Habilitar ou desabilitar atividades de redução de escala na horizontal: capacidade de habilitar ou desabilitar atividades de redução de escala na horizontal para uma política.

Métrica de destino para o Auto Scaling

Nesse tipo de política, uma métrica predefinida ou personalizada e um valor alvo para a métrica são especificados em uma configuração de política de escalabilidade de rastreamento de metas. ElastiCache para Valkey e Redis, o OSS Auto Scaling cria e gerencia CloudWatch alarmes que acionam a política de escalabilidade e calcula o ajuste de escalabilidade com base na métrica e no valor alvo. A política de escalabilidade adiciona ou remove shards/replicas as required to keep the metric at, or close to, the specified target value. In addition to keeping the metric close to the target value, a target-tracking scaling policy also adjusts to fluctuations in the metric due to a changing workload. Such a policy also minimizes rapid fluctuations in the number of available shards/replicas para seu cluster.

Por exemplo, considere uma política de escalabilidade que use a métrica predefinida de média ElastiCachePrimaryEngineCPUUtilization. Essa política pode manter a utilização da CPU a um percentual de utilização específico, por exemplo, 70 por cento, ou próximo a isso.

nota

Para cada cluster, você pode criar somente uma política de Auto Scaling para cada métrica de destino.

Capacidades mínima e máxima

Estilhaços

Você pode especificar o número máximo de fragmentos que podem ser escalados para o escalonamento automático do Valkey e do Redis OSS. ElastiCache Esse valor deve ser menor que ou igual a 250, com um mínimo de 1. Você também pode especificar o número mínimo de fragmentos a serem gerenciados pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de fragmentos de 250.

Réplicas

Você pode especificar o número máximo de réplicas a serem gerenciadas ElastiCache para o escalonamento automático do Valkey e do Redis OSS. Esse valor deve ser igual ou menor que 5. Você também pode especificar o número mínimo de réplicas a serem gerenciadas pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de réplicas de 5.

Para determinar o número mínimo e máximo de fragmentos/réplicas que você precisa para um tráfego típico, teste a configuração do Auto Scaling com a taxa esperada de tráfego para o modelo.

nota

ElastiCache as políticas de auto scaling aumentam a capacidade do cluster até que ele atinja o tamanho máximo definido ou até que os limites de serviço sejam aplicados. Para solicitar um aumento de limite, consulte Limites de serviço da AWS e selecione o tipo de limite Nodes per cluster per instance type (Nós por cluster por tipo de instância).

Importante

Redução de escala na horizontal quando não há tráfego Se o tráfego de uma variante se tornar zero, ElastiCache será automaticamente escalado para o número mínimo de instâncias especificado.

Período de desaquecimento

Você pode ajustar a responsividade das políticas de escalabilidade com monitoramento do objetivo, adicionando períodos de desaquecimento que afetam a escalabilidade de seu cluster. Um desaquecimento bloqueia solicitações subsequentes de redução ou expansão até o período expirar. Isso retarda as exclusões de shards/replicas in your ElastiCache for Valkey and Redis OSS cluster for scale-in requests, and the creation of shards/replicas para solicitações de expansão. Você pode especificar os seguintes desaquecimentos:

  • A atividade de redução de escala horizontal diminui o número de fragmentos/réplicas em seu cluster. Um desaquecimento de redução especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de redução antes que quaisquer outras atividades de redução possam iniciar.

  • A atividade de aumento de escala horizontal aumenta o número de fragmentos/réplicas em seu cluster. Um desaquecimento de expansão especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de expansão antes que quaisquer outras atividades de expansão possam iniciar.

Quando o período de desaquecimento de redução ou aumento de escala na horizontal não é especificado, o padrão para o aumento é de 600 segundos, e para a redução, 900 segundos.

Habilitar ou desabilitar atividades de redução

Você pode habilitar ou desabilitar atividades de redução para as políticas. A ativação de atividades de expansão permite que a política de escalabilidade seja excluída. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas

nota

As atividades de escalabilidade horizontal estão sempre habilitadas para que a política de escalabilidade possa criar ElastiCache fragmentos ou réplicas conforme necessário.