PERF02-BP05 Usar la elasticidad de recursos disponible
La nube ofrece la flexibilidad de ampliar o reducir sus recursos de forma dinámica a través de diversos mecanismos para satisfacer los cambios en la demanda. En combinación con las métricas relacionadas con la informática, una carga de trabajo puede responder automáticamente a los cambios y usar el conjunto óptimo de recursos para alcanzar su objetivo.
Al hacer que la oferta coincida con la demanda de manera óptima, se obtiene el coste más bajo de una carga de trabajo, pero también debe crear un plan para tener una oferta suficiente que le permita contar con tiempo para el aprovisionamiento y los errores de recursos individuales. La demanda puede ser fija o variable, lo que requiere métricas y automatización para garantizar que la administración no se convierta en un coste molesto desproporcionadamente grande.
Con AWS, puede usar varios enfoques diferentes para hacer que la oferta coincida con la demanda. El documento técnico Pilar de optimización de costes describe cómo usar los siguientes enfoques sobre los costes:
-
Enfoque basado en la demanda
-
Enfoque basado en el búfer
-
Enfoque basado en el tiempo
Debe asegurarse de que los despliegues de la carga de trabajo puedan manejar los eventos de escalado y desescalado verticales. Cree escenarios de prueba para eventos de desescalado vertical para asegurarse de que la carga de trabajo se comporta como se espera.
Patrones de uso no recomendados comunes:
-
Reacciona a las alarmas aumentando manualmente la capacidad.
-
Deja la capacidad aumentada después de un evento de ajuste de escala en lugar de volver a desescalar verticalmente.
Beneficios de establecer esta práctica recomendada: configurar y probar la elasticidad de la carga de trabajo ayudará a ahorrar dinero, mantener las referencias de rendimiento y mejorar la fiabilidad a medida que cambia el tráfico. La mayoría de las instancias que no son de producción deben detenerse cuando no se utilizan. Aunque es posible cerrar manualmente las instancias no utilizadas, esto es poco práctico a gran escala. También puede aprovechar la elasticidad basada en el volumen. Esta le permite optimizar el rendimiento y el coste aumentando automáticamente el número de instancias de computación durante los picos de demanda y reduciendo la capacidad cuando la demanda disminuye.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Mediana
Guía para la implementación
Aprovechar la elasticidad: la elasticidad hace coincidir la oferta de los recursos que tiene con la demanda de esos recursos. Las instancias, los contenedores y las funciones proporcionan mecanismos de elasticidad, ya sea en combinación con el escalado automático o como características del servicio. Aproveche la elasticidad de su arquitectura para asegurarse de tener suficiente capacidad para atender los requisitos de rendimiento en todas las escalas de uso. Asegúrese de que las métricas para escalar o desescalar verticalmente los recursos elásticos se validan con respecto al tipo de carga de trabajo que se está desplegando. Si está desplegando una aplicación de transcodificación de vídeo, se espera una utilización del 100 % de la CPU y no debería ser su métrica principal. Como alternativa, puede medir la profundidad de la cola de trabajos de transcodificación en espera de escalar sus tipos de instancia. Asegúrese de que los despliegues de la carga de trabajo puedan manejar los eventos de escalado y desescalado verticales. Desescalar verticalmente los componentes de la carga de trabajo de forma segura es tan importante como escalar verticalmente los recursos cuando la demanda lo requiere. Cree escenarios de prueba para eventos de desescalado vertical para asegurarse de que la carga de trabajo se comporta como se espera.
Recursos
Documentos relacionados:
Vídeos relacionados:
-
Computación mejor, más rápida y barata: optimización de costes Amazon EC2 (CMP202-R1)
-
Ofrecer inferencia de ML con rendimiento alto con AWS Inferentia (CMP324-R1)
-
Optimiza el rendimiento y el coste de AWS Compute (CMP323-R1)
-
Impulsando la siguiente generación Amazon EC2: análisis profundo del sistema Nitro
Ejemplos relacionados: