PERF02-BP03 Recopilar métricas relacionadas con la computación
Para entender el rendimiento de sus recursos de computación, debe registrar y hacer un seguimiento de la utilización de varios sistemas. Estos datos pueden utilizarse para determinar con mayor precisión las requisitos de recursos.
Las cargas de trabajo pueden generar grandes volúmenes de datos como métricas, registros y eventos. Determine si su actual servicio de almacenamiento, supervisión y observabilidad puede administrar los datos generados. Identifique qué métricas reflejan la utilización de los recursos y pueden recopilarse, agregarse y correlacionarse en una única plataforma. Esas métricas deben representar todos sus recursos de carga de trabajo, aplicaciones y servicios, para que pueda obtener fácilmente una visibilidad de todo el sistema e identificar rápidamente las oportunidades y los problemas de mejora del rendimiento.
Resultado deseado: todas las métricas relacionadas con los recursos relacionados con la computación se identifican, recopilan, agregan y correlacionan en una única plataforma con retención implementada para respaldar los costes y los objetivos operativos.
Patrones de uso no recomendados comunes:
-
Solo se utiliza la búsqueda manual de métricas en los archivos de registro.
-
Solo se publican las métricas en las herramientas internas.
-
Solo se utilizan las métricas por defecto registradas por el software de supervisión seleccionado.
-
Solo se revisan las métricas cuando hay un problema.
Beneficios de establecer esta práctica recomendada: para supervisar el rendimiento de las cargas de trabajo, debe registrar múltiples métricas de rendimiento durante un período de tiempo. Estas métricas le permiten detectar anomalías en el rendimiento. También le ayudarán a medir el rendimiento con respecto a las métricas empresariales para asegurarse de que satisface sus necesidades de carga de trabajo.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Alto
Guía para la implementación
Identifique, recopile, agregue y correlacione las métricas relacionadas con la computación. El uso de un servicio como Amazon CloudWatch, puede acelerar la implementación y facilitar su mantenimiento. Además de las métricas predeterminadas registradas, identifique y haga un seguimiento de las métricas adicionales en el nivel del sistema en su carga de trabajo. Registre datos como las métricas de utilización de la CPU, memoria, E/S del disco y red para conocer los niveles de utilización y los cuellos de botella. Estos datos son cruciales para entender el rendimiento de la carga de trabajo y cómo se utiliza la solución de computación. Utilice estas métricas como parte de un enfoque basado en datos para ajustar y optimizar activamente los recursos de su carga de trabajo.
Pasos de implementación:
-
¿Qué métricas de solución de computación son importantes para hacer un seguimiento?
-
¿Dispongo actualmente de una solución de registro y supervisión aprobada?
-
¿He identificado y configurado mis políticas de retención de datos para que se ajusten a mis objetivos de seguridad y operativos?
-
¿Cómo despliega sus agentes de agregación de métricas y registros?
Nivel de esfuerzo para el plan de implementación: hay un nivel medio de esfuerzo para identificar, hacer un seguimiento, recopilar, agregar y correlacionar las métricas de todos los recursos de computación.
Recursos
Documentos relacionados:
Vídeos relacionados:
Ejemplos relacionados: