Políticas de Auto Scaling
Uma política de escalabilidade tem os seguintes componentes:
-
Uma métrica de destino: a métrica do CloudWatch que o ajuste de escala automático do ElastiCache para Valkey e Redis OSS usa para determinar o momento e a quantidade a escalar.
-
Capacidade mínima e máxima: o número mínimo e máximo de fragmentos a ser usado para a escalabilidade.
Importante
Ao criar a política de Auto Scaling, se a capacidade atual for maior do que a capacidade máxima configurada, reduzimos a escala na horizontal até MaxCapacity durante a criação da política. Da mesma forma, se a capacidade atual for menor do que a capacidade mínima configurada, aumentamos a escala na horizontal até MinCapacity.
-
Um período de desaquecimento: a quantidade de tempo, em segundos, que outra ação de aumento ou redução de escala na horizontal deve aguardar antes de ser iniciada, após a conclusão de uma ação de expansão ou redução.
-
Uma função vinculada a serviços: uma função do Identity and Access Management (IAM) da AWS vinculada a um serviço AWS específico. Uma função vinculada ao serviço inclui todas as permissões que o serviço exige para chamar todos os outros serviços da AWS em seu nome. O ajuste de escala automático do ElastiCache gera automaticamente essa função,
AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG, para você. -
Habilitar ou desabilitar atividades de redução de escala na horizontal: capacidade de habilitar ou desabilitar atividades de redução de escala na horizontal para uma política.
Tópicos
Métrica de destino para o Auto Scaling
Neste tipo de política, uma métrica predefinida ou personalizada e um valor de destino dessa métrica são especificados na configuração de uma política de escalabilidade de rastreamento de destino. O ajuste de escala automático do ElastiCache para Valkey e Redis OSS cria e gerencia os alarmes do CloudWatch que acionam a política de escalabilidade e calculam o ajuste de escalabilidade com base na métrica e no valor de destino. A política de escalabilidade adiciona ou remove fragmentos/réplicas conforme necessário para manter a métrica no valor de destino especificado ou próxima a ele. Além de manter a métrica próxima ao valor de destino, uma política de escalabilidade de rastreamento de destino também se ajusta às flutuações na métrica, devido a workloads variáveis. Essas políticas também minimizam flutuações rápidas no número de fragmentos/réplicas disponíveis para seu cluster.
Por exemplo, considere uma política de escalabilidade que use a métrica predefinida de média ElastiCachePrimaryEngineCPUUtilization. Essa política pode manter a utilização da CPU a um percentual de utilização específico, por exemplo, 70 por cento, ou próximo a isso.
nota
Para cada cluster, você pode criar somente uma política de Auto Scaling para cada métrica de destino.
Capacidades mínima e máxima
Fragmentos
Você pode especificar o número máximo de fragmentos que podem ser escalados pelo ajuste de escala automático do ElastiCache para Valkey e Redis OSS. Esse valor deve ser menor que ou igual a 250, com um mínimo de 1. Você também pode especificar o número mínimo de fragmentos a serem gerenciados pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de fragmentos de 250.
Réplicas
Você pode especificar o número máximo de réplicas a serem gerenciadas pelo ajuste de escala automático do ElastiCache para Valkey e Redis OSS. Esse valor deve ser igual ou menor que 5. Você também pode especificar o número mínimo de réplicas a serem gerenciadas pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de réplicas de 5.
Para determinar o número mínimo e máximo de fragmentos/réplicas que você precisa para um tráfego típico, teste a configuração do Auto Scaling com a taxa esperada de tráfego para o modelo.
nota
As políticas de escalabilidade automática do ElastiCache aumentam a capacidade do cluster até atingir o tamanho máximo definido ou até que os limites do serviço sejam aplicados. Para solicitar um aumento de limite, consulte Limites de serviço da AWS e selecione o tipo de limite Nodes per cluster per instance type (Nós por cluster por tipo de instância).
Importante
Redução de escala na horizontal quando não há tráfego Se o tráfego de uma variante atingir zero, o ElastiCache automaticamente reduz a escala na horizontal para o número mínimo de instâncias especificado.
Período de desaquecimento
Você pode ajustar a responsividade das políticas de escalabilidade com monitoramento do objetivo, adicionando períodos de desaquecimento que afetam a escalabilidade de seu cluster. Um desaquecimento bloqueia solicitações subsequentes de redução ou expansão até o período expirar. Isso atrasa as exclusões de fragmentos/réplicas no cluster do ElastiCache para Valkey e Redis OSS para solicitações de redução de escala horizontal e a criação de fragmentos/réplicas para solicitações de aumento de escala horizontal. Você pode especificar os seguintes desaquecimentos:
-
A atividade de redução de escala horizontal diminui o número de fragmentos/réplicas em seu cluster. Um desaquecimento de redução especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de redução antes que quaisquer outras atividades de redução possam iniciar.
-
A atividade de aumento de escala horizontal aumenta o número de fragmentos/réplicas em seu cluster. Um desaquecimento de expansão especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de expansão antes que quaisquer outras atividades de expansão possam iniciar.
Quando o período de desaquecimento de redução ou aumento de escala na horizontal não é especificado, o padrão para o aumento é de 600 segundos, e para a redução, 900 segundos.
Habilitar ou desabilitar atividades de redução
Você pode habilitar ou desabilitar atividades de redução para as políticas. Habilitar atividades de redução de escala na horizontal permite que as políticas de escalabilidade excluam fragmentos/réplicas. Quando as atividades de redução são habilitadas, o desaquecimento de redução na política de escalabilidade aplica-se a atividades de redução. Desabilitar atividades de redução de escala na horizontal evita que as políticas de escalabilidade excluam fragmentos/réplicas.
nota
As atividades de aumento de escala na horizontal são habilitadas para que a política de escalabilidade possa criar fragmentos ou réplicas do ElastiCache, conforme o necessário.