Plano de control aprovisionado de Amazon EKS - Amazon EKS

Ayude a mejorar esta página

Para contribuir a esta guía del usuario, elija el enlace Edit this page on GitHub que se encuentra en el panel derecho de cada página.

Plano de control aprovisionado de Amazon EKS

Descripción general

El plano de control aprovisionado de Amazon EKS es una característica que permite a los administradores de clústeres seleccionar entre un conjunto de niveles de escalado y designar el nivel que elijan para obtener un rendimiento muy alto y predecible desde el plano de control del clúster. Esto permite a los administradores de clústeres garantizar que el plano de control siempre esté aprovisionado con la capacidad especificada.

Amazon EKS ofrece dos modos de operación para el plano de control del clúster. De forma predeterminada, los clústeres de Amazon EKS utilizan el modo estándar, en el que el plano de control se escala y se reduce verticalmente en función de las exigencias de la carga de trabajo. El modo estándar asigna dinámicamente la capacidad suficiente del plano de control para satisfacer sus necesidades de carga de trabajo y es la solución recomendada para la mayoría de los casos de uso. Sin embargo, para las cargas de trabajo especializadas que no toleran ninguna variabilidad en el rendimiento debido al escalado del plano de control o aquellas que requieren una capacidad muy alta del plano de control, puede utilizar opcionalmente el modo aprovisionado. El modo aprovisionado le permite asignar previamente la capacidad del plano de control para que siempre esté lista para gestionar los exigentes requisitos de la carga de trabajo.

nota

El modo aprovisionado es un modo de operaciones del plano de control adicional junto con el modo estándar predeterminado. La introducción del modo aprovisionado no cambia el comportamiento del modo estándar.

Con el plano de control aprovisionado de EKS, los administradores de clústeres pueden aprovisionar previamente la capacidad deseada del plano de control con antelación, lo que proporciona un rendimiento alto y predecible desde el plano de control del clúster, que siempre está disponible. El plano de control aprovisionado de EKS también permite a los administradores de clústeres aprovisionar la misma capacidad de plano de control en todos los entornos, desde los sitios de pruebas a los de producción y recuperación ante desastres. Es importante para garantizar que el rendimiento del plano de control obtenido en todos los entornos sea coherente y predecible. Por último, el plano de control aprovisionado de EKS le permite acceder a niveles muy altos de rendimiento del plano de control, lo que le permite ejecutar cargas de trabajo de IA escalables de forma masiva, computación de alto rendimiento y cargas de trabajo de procesamiento de datos a gran escala en Kubernetes.

Todos los clústeres de Amazon EKS nuevos y existentes funcionan en modo estándar de forma predeterminada. Para los clústeres que requieren un rendimiento alto y predecible desde el plano de control, puede optar por utilizar la característica del plano de control aprovisionado de EKS. Se le facturará la tarifa por hora correspondiente al nivel de escalado del plano de control concreto, además de las tarifas por hora de EKS de soporte estándar o ampliado. Para obtener más información acerca de los precios, consulte Precios de Amazon EKS.

Modos del plano de control de Amazon EKS

Casos de uso

El plano de control aprovisionado de EKS está diseñado para abordar situaciones específicas en las que un rendimiento alto y predecible del plano de control es fundamental para sus operaciones. Comprender estos casos de uso puede ayudarlo a determinar si el plano de control aprovisionado de EKS es la solución adecuada para sus cargas de trabajo.

Cargas de trabajo críticas para el rendimiento: para las cargas de trabajo que exigen una latencia mínima y un rendimiento máximo del plano de control de Kubernetes, el plano de control aprovisionado de EKS proporciona una capacidad que elimina la variabilidad del rendimiento al escalar el plano de control.

Cargas de trabajo con escalabilidad masiva: si ejecuta cargas de trabajo con alta escalabilidad, como inferencia y entrenamiento de IA, computación de alto rendimiento o procesamiento de datos a gran escala que requieren la ejecución de una gran cantidad de nodos en el clúster, el plano de control aprovisionado proporciona la capacidad de plano de control necesaria para soportar estas cargas de trabajo exigentes.

Eventos anticipados de alta demanda: cuando espere un aumento repentino de las solicitudes del plano de control debido a un evento próximo, como rebajas o promociones de comercio electrónico, lanzamientos de productos, temporadas de compras festivas o eventos deportivos o de entretenimiento importantes, el plano de control aprovisionado le permite escalar la capacidad del plano de control por adelantado. Este enfoque proactivo garantiza que el plano de control esté preparado para soportar el aumento de carga sin tener que esperar a que se escale automáticamente para responder a la demanda.

Coherencia del entorno: el plano de control aprovisionado le permite igualar la capacidad y el rendimiento del plano de control en los entornos de preparación y producción, lo que lo ayuda a identificar posibles problemas con antelación antes de la implementación en producción. Al mantener el mismo nivel del plano de control en todos los entornos, puede asegurarse de que los resultados de las pruebas reflejen con precisión el comportamiento de la producción, lo que reduce el riesgo de sorpresas relacionadas con el rendimiento durante la implementación.

Recuperación ante desastres y continuidad empresarial: para escenarios de recuperación ante desastres, el plano de control aprovisionado le permite aprovisionar entornos de conmutación por error con el mismo nivel de capacidad que el entorno principal. Esto garantiza una interrupción mínima y una recuperación rápida durante los eventos de conmutación por error, ya que el clúster de recuperación ante desastres tendrá características de rendimiento en el plano de control idénticas a las del clúster de producción desde el momento en que se active.

Niveles de escalado del plano de control

El plano de control aprovisionado de EKS ofrece niveles de escalado con el mismo nombre que las tallas de camisetas (XL, 2XL, 4XL). Cada nivel define su capacidad mediante tres atributos clave de Kubernetes que determinan las características de rendimiento del plano de control del clúster. Comprender estos atributos lo ayuda a seleccionar el nivel adecuado para sus requisitos de cargas de trabajo.

La simultaneidad de solicitudes de API mide la cantidad de solicitudes que el servidor de API del plano de control de Kubernetes puede procesar simultáneamente, lo cual es fundamental para las cargas de trabajo de alto rendimiento.

La frecuencia de programación de los pods indica la rapidez con la que el programador predeterminado de Kubernetes puede programar los pods en los nodos, que se mide en pods por segundo.

El tamaño de la base de datos del clúster indica el espacio de almacenamiento asignado a etcd, la base de datos que contiene el estado y los metadatos del clúster.

Al aprovisionar el plano de control del clúster en un nivel de escalado determinado mediante el plano de control aprovisionado, EKS garantiza que el plano de control del clúster mantenga los límites correspondientes a ese nivel. Los límites de los niveles de escalado del plano de control varían en función de la versión de Kubernetes, como se muestra en las siguientes tablas.

EKS v1.28 y v1.29

Nivel de escalado del plano de control aprovisionado Simultaneidad de solicitudes de la API (plazas) Frecuencia de programación de los pods (pods/seg) Tamaño de la base de datos del clúster (GB)

XL

1700

100

16

2XL

3400

100

16

4XL

6800

100

16

EKS v1.30 y versiones posteriores

Nivel de escalado del plano de control aprovisionado Simultaneidad de solicitudes de la API (plazas) Frecuencia de programación de los pods (pods/seg) Tamaño de la base de datos del clúster (GB)

XL

1700

167

16

2XL

3400

283

16

4XL

6800

400

16

Supervisión del uso de los niveles de escalado del plano de control

Amazon EKS proporciona varias métricas para ayudarlo a supervisar el uso de los niveles del plano de control. Estas métricas se publican como métricas de Amazon CloudWatch y se puede acceder a ellas a través de las consolas de CloudWatch y EKS. Además, estas métricas se pueden extraer del punto de conexión de Prometheus del clúster de EKS (consulte esta página).

Métrica de Prometheus Métrica de CloudWatch

Simultaneidad de solicitudes de la API

apiserver_flowcontrol_current_executing_seats

apiserver_flowcontrol_current_executing_seats

Frecuencia de programación de pod

scheduler_schedule_attempts_total

scheduler_schedule_attempts_total, scheduler_schedule_attempts_SCHEDULED, scheduler_schedule_attempts_UNSCHEDULABLE

Tamaño de la base de datos del clúster

apiserver_storage_size_bytes

apiserver_storage_size_bytes

Puede ver la utilización del plano de control en la consola de Amazon EKS. En la página de información general del clúster, seleccione Supervisar clúster para acceder al panel de observabilidad. Luego, seleccione la pestaña Supervisión del plano de control para ver la utilización del plano de control en la sección Escalado del plano de control.

Supervisión del clúster de EKS
Supervisión del plano de control de EKS

Descripción de la capacidad de los niveles frente al rendimiento real

Cuando selecciona un nivel de escalado del plano de control aprovisionado, los atributos del nivel representan las configuraciones subyacentes que aplica Amazon EKS al plano de control. Sin embargo, el rendimiento real que logre depende de los patrones de carga de trabajo específicos, las configuraciones y el cumplimiento de las prácticas recomendadas de Kubernetes. Por ejemplo, si bien un nivel 4XL configura la prioridad y equidad de la API (APF) con 6800 solicitudes simultáneas, el rendimiento real de las solicitudes que se obtienen desde el plano de control depende del tipo de operaciones que se lleven a cabo. Por ejemplo, Kubernetes penaliza más las solicitudes de lista que las de obtención y, por lo tanto, la cantidad efectiva de solicitudes de lista procesadas simultáneamente por el plano de control es inferior al de las solicitudes de obtención (consulte esta página). Del mismo modo, aunque el QPS del programador predeterminado se establece en 400 para un nivel 4XL, la tasa real de programación del pod depende de factores como la preparación de los nodos y su estado para la programación. Para lograr un rendimiento óptimo, asegúrese de que las aplicaciones sigan las prácticas recomendadas de Kubernetes (consulte esta página) y de que estén configuradas correctamente según las características de la carga de trabajo.

Consideraciones

  • Capacidad del plano de control estándar: el modo del plano de control estándar de EKS ofrece la mejor relación entre precio y rendimiento y es la opción recomendada para la gran mayoría de los casos de uso. Sin embargo, para las cargas de trabajo especializadas que no toleran ninguna variabilidad en el rendimiento debido al escalado del plano de control o aquellas que requieren una capacidad muy alta del plano de control, puede plantearse opcionalmente el modo aprovisionado.

  • Suscripción obligatoria: los clústeres existentes no se escalarán verticalmente de forma automática desde el plano de control estándar a un nivel del plano de control aprovisionado de EKS más caro. Debe suscribirse de forma explícita a uno de los nuevos niveles de escalado del plano de control aprovisionado de EKS.

  • Restricción de salida: el modo de plano de control estándar admite hasta 8 GB de tamaño de base de datos del clúster (etcd). Si el tamaño de la base de datos del clúster supera los 8 GB mientras utiliza el modo aprovisionado, no podrá volver al modo estándar hasta que reduzca el tamaño de la base de datos a menos de 8 GB. Por ejemplo, si utiliza 14 GB de almacenamiento de base de datos en el modo aprovisionado, debe reducir previamente el uso de la base de datos a menos de 8 GB antes de volver al modo estándar.

  • Sin escalado automático de niveles: el plano de control aprovisionado de EKS no escala automáticamente entre niveles. Una vez que selecciona un nivel de escalado, el plano de control del clúster permanece fijo en ese nivel, lo que garantiza un rendimiento coherente y predecible. Sin embargo, tiene la flexibilidad de implementar su propia solución de escalado automático mediante la supervisión de las métricas de uso de los niveles y el uso de las API del plano de control aprovisionado de EKS para reducir o escalar verticalmente cuando estas métricas superen los umbrales definidos, lo que le ofrece un control total sobre su estrategia de escalado y la optimización de costos.

  • Visualización del nivel actual: puede utilizar la consola de Amazon EKS, la Amazon Web Services CLI o la API para ver el nivel de escalado del plano de control actual. En la CLI, puede ejecutar el comando describe-cluster: aws eks describe-cluster --name cluster-name

  • Tiempo de transición entre niveles: puede utilizar la consola de Amazon EKS, las API de Amazon EKS o la CLI para salir de los niveles de escalado o moverse entre ellos. Amazon EKS ha introducido un nuevo tipo de actualización de clústeres denominado ScalingTierConfigUpdate, que puede inspeccionar para supervisar el progreso de la transición. Después de ejecutar un comando de cambio de nivel, puede enumerar las actualizaciones del clúster para ver una nueva actualización del tipo ScalingTierConfigUpdate con el estado Updating. El estado cambia a Successful al finalizar la actualización o a Failed si se produce un error. El campo de error de la actualización indica el motivo del error. No hay restricciones en cuanto a la frecuencia con la que puede cambiar de nivel. El cambio del nivel del plano de control tarda varios minutos en completarse.

  • Selección del nivel óptimo: para determinar el nivel de escalado del plano de control aprovisionado óptimo para el clúster, puede llevar a cabo pruebas de carga mediante el aprovisionamiento del clúster en el nivel más alto (4XL). A continuación, lleve a cabo una prueba de carga para simular los picos de demanda en el plano de control del clúster. Observe las métricas de uso de los niveles del plano de control en los momentos de máxima carga y utilice estas observaciones como factor guía para seleccionar el nivel adecuado para el modo aprovisionado.

  • Precios del plano de control aprovisionado: se le facturará según la tarifa por hora correspondiente al nivel de escalado del plano de control aprovisionado en el que se encuentre el clúster. Esto se suma a los cargos por hora de soporte estándar o ampliado. Consulte la página de precios de EKS para obtener información detallada.

  • Nivel de escalado más grande: si tiene previsto ejecutar el clúster en un nivel de escalado superior a 4XL, contacte con el equipo de cuentas de Amazon Web Services para obtener información adicional sobre los precios.

  • Compatibilidad con la versión y la región de Kubernetes: el plano de control aprovisionado de EKS se admite en todas las regiones comerciales de Amazon Web Services, GovCloud y China. El plano de control aprovisionado funciona en EKS v1.28 y versiones posteriores.