Alertas - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Alertas

Las alertas son unos de los orígenes de información más importantes en materia de seguridad, disponibilidad, rendimiento y fiabilidad de la infraestructura y los servicios de TI. Notifican e informan a los equipos de TI sobre las amenazas de seguridad actuales, las interrupciones, los problemas de rendimiento o los errores del sistema.

La Biblioteca de Infraestructura de Tecnología de la Información (ITIL), en concreto las prácticas de administración de servicios de TI (ITSM), establece las alertas automatizadas como el punto central de las prácticas recomendadas de supervisión y administración de eventos y administración de incidentes.

Las alertas de incidentes se producen cuando las herramientas de supervisión generan alertas para notificar al equipo y a las herramientas automatizadas (en el caso de los elementos que se pueden procesar automáticamente) sobre cambios, acciones de alto riesgo o errores en el entorno de TI. Las alertas de TI son la primera línea de defensa contra las interrupciones del sistema o los cambios que pueden convertirse en incidentes graves. Al supervisar automáticamente los sistemas y generar alertas en caso de interrupciones y cambios riesgosos, los equipos de TI pueden minimizar el tiempo de inactividad y reducir los altos costos que conlleva.

Como prácticas recomendadas, el AWS Well-Architected Framework prescribe que utilice la supervisión para generar notificaciones basadas en alarmas y que supervise y alarme de forma proactiva. Utilice CloudWatch un servicio de monitoreo externo para configurar alarmas que indiquen cuándo las métricas están fuera de los límites esperados.

El objetivo de la administración de alertas es establecer procedimientos estandarizados y eficientes para administrar los eventos e incidentes relacionados con TI mediante el registro, la clasificación, la definición e implementación de las acciones, el cierre y las actividades de revisión posteriores a los incidentes.

Secciones