Métrica de destino para Auto Scaling Capacidad mínima y máxima Periodo de recuperación Activar o desactivar actividades de escalado descendente

Políticas de Auto Scaling

Una directiva de escalado tiene los siguientes componentes:

Una métrica objetivo: la CloudWatch métrica que ElastiCache Auto Scaling OSS de Valkey y Redis utiliza para determinar cuándo y cuánto escalar.
Capacidad mínima y máxima: el número mínimo y máximo de particiones o réplicas que se utilizarán para el escalado.

importante
Al crear la política de escalado automático, si la capacidad actual es superior a la capacidad máxima configurada, la aplicamos MaxCapacity durante la creación de la política. Del mismo modo, si la capacidad actual es inferior a la capacidad mínima configurada, escalamos hacia fuera hasta la. MinCapacity
Un periodo de recuperación: la cantidad de tiempo, en segundos, tras completarse una actividad de reducción o escalado horizontal antes de que pueda comenzar otra actividad de escalado horizontal.
Un rol vinculado a un servicio: un rol de AWS Identity and Access Management (IAM) que está vinculado a un servicio específico. AWS Un rol vinculado a un servicio incluye todos los permisos que el servicio requiere para llamar a otros AWS servicios en tu nombre. ElastiCache Auto Scaling genera automáticamente este rol para usted. AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG
Habilitar o deshabilitar actividades de reducción horizontal: permite habilitar o deshabilitar actividades de reducción horizontal para una política.

Temas

Métrica de destino para Auto Scaling
Capacidad mínima y máxima
Periodo de recuperación
Activar o desactivar actividades de escalado descendente

Métrica de destino para Auto Scaling

En este tipo de política, se especifican una métrica predefinida o personalizada y un valor objetivo para la métrica en una configuración de política de escalado de seguimiento de objetivos. ElastiCache para Valkey y Redis, OSS Auto Scaling crea y gestiona CloudWatch las alarmas que activan la política de escalado y calcula el ajuste de escalado en función de la métrica y el valor objetivo. La política de escalado agrega o elimina shards/replicas según sea necesario para mantener la métrica en el valor objetivo especificado o cerca de él. Además de mantener la métrica próxima al valor de destino, la política de escalado de seguimiento de destino también se ajusta a las fluctuaciones de la métrica producidas por una carga de trabajo en constante cambio. Esta política también minimiza las fluctuaciones rápidas en la cantidad de recursos disponibles shards/replicas para el clúster.

Por ejemplo, considere una política de escalado que utilice la métrica ElastiCachePrimaryEngineCPUUtilization media predefinida. Esta política puede mantener la utilización de la CPU en el porcentaje de utilización especificado o en un valor próximo, como el 70 %.

nota

Para cada clúster, puede crear solo una política de Auto Scaling para cada métrica de destino.

Capacidad mínima y máxima

Particiones

Puede especificar la cantidad máxima de fragmentos a los que se puede escalar ElastiCache para el autoescalado de Valkey y Redis OSS. Este valor debe ser igual o inferior a 250 con un mínimo de 1. También puede especificar el número mínimo de particiones que va a administrar por medio del escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 250 particiones.

Réplicas

Puede especificar el número máximo de réplicas que administrará para el autoescalado ElastiCache de Valkey y Redis OSS. Este valor debe ser igual o inferior a 5. También puede especificar el número mínimo de réplicas que va a administrar mediante el escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 5 réplicas.

Para determinar la cantidad mínima y máxima shards/replicas que necesita para el tráfico típico, pruebe la configuración de Auto Scaling con la velocidad de tráfico esperada para su modelo.

nota

ElastiCache las políticas de escalado automático aumentan la capacidad del clúster hasta que alcance el tamaño máximo definido o hasta que se apliquen los límites de servicio. Para solicitar un aumento del límite, consulte AWS Service Limits y elija el tipo de límite Nodes per cluster per instance type (Nodos por clúster por tipo de instancias).

importante

Scaling-in se produce cuando no hay tráfico. Si el tráfico de una variante pasa a cero, se amplía ElastiCache automáticamente al número mínimo de instancias especificado.

Periodo de recuperación

Puede ajustar la capacidad de respuesta de una política de escalado de seguimiento de destino al agregar periodos de recuperación que afecten al escalado de su clúster. Un periodo de recuperación bloquea solicitudes de escalado descendente o ascendente posteriores hasta que vence el periodo. Esto ralentiza las eliminaciones shards/replicas en el clúster de OSS de Valkey y Redis en el caso de las solicitudes de escalamiento interno y la creación de las solicitudes de escalado horizontal. ElastiCache shards/replicas Puede especificar los siguientes periodos de recuperación:

Una actividad de escalado interno reduce la cantidad de componentes del clúster. shards/replicas Un periodo de recuperación de escalado descendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado descendente antes de que pueda comenzar otra actividad de escalado descendente.
Una actividad de escalamiento horizontal aumenta la cantidad de shards/replicas personas en el clúster. Un periodo de recuperación de escalado ascendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado ascendente antes de que pueda comenzar otra actividad de escalado ascendente.

Si no se especifica un periodo de recuperación de reducción o escalado horizontal, el valor predeterminado del escalado horizontal es de 600 segundos y de la reducción horizontal es de 900 segundos.

Activar o desactivar actividades de escalado descendente

Puede habilitar o deshabilitar actividades de escalado descendente para una política. Al habilitar las actividades de escalado interno, se puede eliminar la política de escalado. shards/replicas Al habilitarse actividades de escalado descendente, el periodo de recuperación de escalado descendente de la política de escalado se aplica a las actividades de escalado descendente. Al deshabilitar las actividades de escalado horizontal, se evita que se elimine la política de escalado. shards/replicas

nota

Scale-out las actividades siempre están habilitadas para que la política de escalado pueda crear ElastiCache fragmentos o réplicas según sea necesario.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Clústeres de escalado automático de Valkey y Redis OSS

Uso de Auto Scaling con particiones