OPS08-BP04 Establecer puntos de referencias de métricas de cargas de trabajo
El establecimiento de un punto de referencia para las métricas de la carga de trabajo ayuda a comprender el estado y el rendimiento de la carga de trabajo. Mediante el uso de líneas de referencia, es posible identificar aplicaciones y componentes de bajo y alto rendimiento. Una línea de referencia de la carga de trabajo aumenta su capacidad de mitigar los contratiempos antes de que se conviertan en incidentes. Las líneas de referencia son fundamentales para desarrollar patrones de actividad e implementar la detección de anomalías cuando las métricas se desvían de los valores esperados.
Resultado deseado:
-
Dispone de un nivel de referencia de las métricas de la carga de trabajo en condiciones normales.
-
Puede determinar si la carga de trabajo funciona con normalidad.
Antipatrones usuales:
-
Tras el despliegue de una nueva característica, se produce un descenso de la latencia de las solicitudes. No se ha establecido una línea de referencia para una métrica compuesta de solicitudes entrantes procesadas y de latencia global. No es posible determinar si el cambio ha causado una mejora o un defecto.
-
Se produce un pico repentino en la actividad de los usuarios, pero no se ha establecido una línea de referencia de las métricas. El pico de actividad conduce lentamente a una pérdida de memoria de una aplicación. Con el tiempo, la carga de trabajo pierde la conexión.
Beneficios de establecer esta práctica recomendada:
-
Comprenderá el patrón normal de actividad de su carga de trabajo mediante métricas para componentes y aplicaciones clave.
-
Podrá determinar si la carga de trabajo, las aplicaciones y los componentes se comportan con normalidad o si es preciso una intervención.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
Utilice datos históricos para establecer una línea de referencia de las métricas de la carga de trabajo para aplicaciones y componentes de su carga de trabajo. Utilice la línea de referencia de las métricas en las reuniones de revisión de métricas y en la solución de problemas. Revise periódicamente el rendimiento de la carga de trabajo y ajuste la línea de referencia a medida que evoluciona la arquitectura.
Ejemplo de cliente
Se establecen líneas de referencia para todos los componentes y aplicaciones de AnyCompany Retail. Utilizando datos históricos, AnyCompany Retail desarrolló sus líneas de referencia de las métricas de la carga de trabajo en un intervalo de medición de dos meses. Cada dos meses se vuelven a evaluar las líneas de referencia y se ajustan en función de los datos de la vida real.
Pasos para la implementación
-
Trabajando en sentido inverso de las métricas de la carga de trabajo, establezca una línea de referencia de las métricas de los componentes y aplicaciones clave mediante los datos históricos. Limite el número de métricas por componente o aplicación y evite la fatiga visual.
-
Puede utilizar Amazon CloudWatch Metrics Insights para consultar métricas a escala e identificar tendencias y patrones.
-
La detección de anomalías de Amazon CloudWatch utiliza algoritmos de machine learning para identificar patrones de comportamiento de las métricas, determinar líneas de referencia y revelar anomalías.
-
Amazon DevOps Guru ofrece la posibilidad de detectar problemas operativos de la carga de trabajo mediante machine learning.
-
Los clientes con Enterprise Support pueden solicitar el taller Building a Monitoring Strategy Workshop
(Creación de una estrategia de supervisión) a su gerente técnico de cuentas. Este taller le ayudará a erigir una estrategia de observabilidad para su carga de trabajo.
-
-
Ponga en práctica un mecanismo para revisar periódicamente las líneas de referencia de las métricas de la carga de trabajo, especialmente antes de eventos empresariales significativos. Al menos una vez cada trimestre, evalúe la línea de referencia de su métrica de carga de trabajo por medio de los datos históricos. Utilice la línea de referencia en las reuniones de revisión de métricas.
Nivel de esfuerzo para el plan de implementación: bajo. Una vez instauradas las métricas de la carga de trabajo, el establecimiento de líneas de referencia requerirá la recopilación de una cantidad suficientes datos para identificar patrones normales de comportamiento.
Recursos
Prácticas recomendadas relacionadas:
-
OPS08-BP02 Definir las métricas de las cargas de trabajo - En primer lugar, deben establecerse los parámetros de la carga de trabajo antes de determinar las líneas de referencia.
-
OPS08-BP03 Recopilar y analizar métricas de cargas de trabajo - Es necesario recopilar y analizar las métricas de la carga de trabajo antes de establecer las líneas de referencia de las métricas.
-
OPS08-BP05 Descubrir los patrones esperados de actividad para la carga de trabajo - Esta práctica recomendada se basa en la línea de referencia para desarrollar tendencias de uso.
-
OPS08-BP06 Alertar cuando los resultados de la carga de trabajo corren riesgo - Las líneas de referencia de las métricas son necesarias para identificar umbrales y perfeccionar alertas.
-
OPS08-BP07 Alertar cuando se detectan anomalías en la carga de trabajo - La detección de anomalías exige el establecimiento de líneas de referencia de las métricas.
Documentos relacionados:
-
AWS Observability Best Practices - Alarms
(Prácticas recomendadas de observabilidad de AWS: alarmas) -
How to set up CloudWatch Anomaly Detection to set dynamic alarms, automate actions, and drive online sales
(Cómo configurar la detección de anomalías de CloudWatch para establecer alarmas dinámicas, automatizar acciones y fomentar las ventas en línea) -
Operationalizing CloudWatch Anomaly Detection
(Operatividad de la detección de CloudWatch)
Vídeos relacionados:
-
AWS re:Invent 2020: Monitoring production services at Amazon
(AWS re:Invent 2020: Supervisión de los servicios de producción en Amazon) -
AWS re:Invent 2021- Get insights from operational metrics at scale with CloudWatch Metrics Insights
(AWS re:Invent 2021: Obtenga información de las métricas operativas a escala con CloudWatch Metrics Insights) -
AWS re:Invent 2022 - Developing an observability strategy (COP302)
(AWS re:Invent 2022: Desarrollo de una estrategia de observabilidad) -
AWS Summit DC 2022 - Monitoring and observability for modern applications
(Supervisión y observabilidad de las aplicaciones modernas) -
AWS Summit SF 2022 - Full-stack observability and application monitoring with AWS (COP310)
(Observabilidad completa y supervisión de aplicaciones con AWS)
Ejemplos relacionados:
-
AWS CloudTrail and Amazon CloudWatch Integration Workshop
(Taller de integración de AWS CloudTrail y Amazon CloudWatch)
Servicios relacionados: