Políticas de Auto Scaling
Una directiva de escalado tiene los siguientes componentes:
-
Una métrica de destino: es la métrica de CloudWatch que utiliza el escalado automático de ElastiCache para Valkey y Redis OSS para determinar cuándo escalar y en qué medida.
-
Capacidad mínima y máxima: el número mínimo y máximo de particiones o réplicas que se utilizarán para el escalado.
importante
Al crear la política de Auto Scaling, si la capacidad actual es superior a la capacidad máxima configurada, reducimos verticalmente hasta estar en la capacidad máxima durante la creación de la política. Del mismo modo, si la capacidad actual es inferior a la capacidad mínima configurada, escalamos horizontalmente hasta la capacidad mínima.
-
Un periodo de recuperación: la cantidad de tiempo, en segundos, tras completarse una actividad de reducción o escalado horizontal antes de que pueda comenzar otra actividad de escalado horizontal.
-
Un rol vinculado a servicios: un rol de AWS Identity and Access Management (IAM) que se encuentra vinculado a un servicio de AWS específico. Un rol vinculado a servicios incluye todos los permisos que requiere el servicio para llamar a otros servicios de AWS en su nombre. El escalado automático de ElastiCache genera este rol,
AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG, de forma automática en su nombre. -
Habilitar o deshabilitar actividades de reducción horizontal: permite habilitar o deshabilitar actividades de reducción horizontal para una política.
Temas
Métrica de destino para Auto Scaling
En este tipo de política, una métrica predefinida o personalizada y un valor de destino de la métrica se especifica en una configuración de la política de escalado de seguimiento de destino. El escalado automático de ElastiCache para Valkey y Redis OSS crea y administra las alarmas de CloudWatch que desencadenan la política de escalado y calcula el ajuste de escalado en función de la métrica y el valor objetivo. La política de escalado agrega o elimina las particiones/réplicas en función de las necesidades para mantener la métrica en el valor objetivo especificado o en un valor próximo. Además de mantener la métrica próxima al valor de destino, la política de escalado de seguimiento de destino también se ajusta a las fluctuaciones de la métrica producidas por una carga de trabajo en constante cambio. Esta política también minimiza las fluctuaciones rápidas del número de particiones/réplicas disponibles de su clúster.
Por ejemplo, considere una política de escalado que utilice la métrica ElastiCachePrimaryEngineCPUUtilization media predefinida. Esta política puede mantener la utilización de la CPU en el porcentaje de utilización especificado o en un valor próximo, como el 70 %.
nota
Para cada clúster, puede crear solo una política de Auto Scaling para cada métrica de destino.
Capacidad mínima y máxima
Particiones
Puede especificar el número máximo de particiones que se puede escalar mediante el escalado automático de ElastiCache para Valkey y Redis OSS. Este valor debe ser igual o inferior a 250 con un mínimo de 1. También puede especificar el número mínimo de particiones que va a administrar por medio del escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 250 particiones.
Réplicas
Puede especificar el número máximo de réplicas que va a administrar por medio del escalado automático de ElastiCache para Valkey y Redis OSS. Este valor debe ser igual o inferior a 5. También puede especificar el número mínimo de réplicas que va a administrar mediante el escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 5 réplicas.
A fin de determinar el número mínimo y máximo de particiones/réplicas que necesite para el tráfico normal, pruebe la configuración de Auto Scaling con la tasa de tráfico esperada para su modelo.
nota
Las políticas de escalado automático de ElastiCache aumentan la capacidad del clúster hasta que alcanza el tamaño máximo definido o hasta que se apliquen los límites de servicio. Para solicitar un aumento del límite, consulte AWS Service Limits y elija el tipo de límite Nodes per cluster per instance type (Nodos por clúster por tipo de instancias).
importante
La reducción horizontal sucede cuando no hay tráfico. Si el tráfico de una variante es cero, ElastiCache reduce horizontalmente de forma automática al número mínimo de instancias especificadas.
Periodo de recuperación
Puede ajustar la capacidad de respuesta de una política de escalado de seguimiento de destino al agregar periodos de recuperación que afecten al escalado de su clúster. Un periodo de recuperación bloquea solicitudes de escalado descendente o ascendente posteriores hasta que vence el periodo. Esto ralentiza las eliminaciones de particiones o réplicas del clúster de ElastiCache para Valkey y Redis OSS para solicitudes de reducción horizontal y la creación de particiones o réplicas para solicitudes de escalado horizontal. Puede especificar los siguientes periodos de recuperación:
-
Una actividad de reducción horizontal reduce el número de particiones/réplicas del clúster. Un periodo de recuperación de escalado descendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado descendente antes de que pueda comenzar otra actividad de escalado descendente.
-
Una actividad de escalado horizontal incrementa el número de particiones/réplicas del clúster. Un periodo de recuperación de escalado ascendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado ascendente antes de que pueda comenzar otra actividad de escalado ascendente.
Si no se especifica un periodo de recuperación de reducción o escalado horizontal, el valor predeterminado del escalado horizontal es de 600 segundos y de la reducción horizontal es de 900 segundos.
Activar o desactivar actividades de escalado descendente
Puede habilitar o deshabilitar actividades de escalado descendente para una política. La habilitación de actividades de reducción horizontal permite a la política de escalado eliminar particiones/réplicas. Al habilitarse actividades de escalado descendente, el periodo de recuperación de escalado descendente de la política de escalado se aplica a las actividades de escalado descendente. La deshabilitación de actividades de reducción horizontal impide a la política de escalado eliminar particiones/réplicas.
nota
Las actividades de escalado horizontal siempre se habilitan de modo que la política de escalado pueda crear particiones o réplicas de ElastiCache según sea necesario.