Descripción general - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Descripción general

La supervisión y las alertas se incluyen en cuatro pilares del marco de AWS Well-Architected.

  • El pilar de la excelencia operativa establece que la carga de trabajo debe diseñarse de manera que incluya la telemetría y la supervisión. Los productos de AWS como Amazon Relational Database Service (Amazon RDS) proporcionan la información necesaria para que pueda comprender el estado interno de la carga de trabajo (por ejemplo, métricas, registros, eventos y seguimientos). Cuando utilice las bases de datos de Amazon RDS, querrá comprender el estado de las instancias de las bases de datos, detectar eventos operativos y poder responder a eventos planificados y no planificados. AWS proporciona herramientas de supervisión que son útiles para determinar cuándo están en riesgo los resultados de la organización y el negocio o podrían estarlo, para que pueda tomar las medidas adecuadas en el momento adecuado.

  • El pilar de la eficiencia del rendimiento prescribe que debe supervisar el rendimiento de los recursos, como las instancias de base de datos de Amazon RDS, mediante la recopilación, la agregación y el procesamiento de métricas relacionadas con el rendimiento en tiempo real. Puede identificar la degradación del rendimiento y corregir los factores que la provocaron (por ejemplo, consultas SQL no optimizadas o parámetros de configuración inadecuados). Puede activar las alarmas de manera automática cuando las mediciones superen los límites esperados. Le recomendamos utilizar las alarmas no solo para las notificaciones, sino también para iniciar acciones automatizadas en respuesta a los eventos detectados. Puede evaluar las métricas que recopila en función de los umbrales predefinidos o utilizar algoritmos de machine learning para identificar un comportamiento anómalo. Por ejemplo, para detectar una tendencia del aumento del uso de la CPU, puede recopilar y analizar la métrica cpuUtilization.total durante un periodo. Alertar sobre esa anomalía de manera proactiva, antes de que el uso de la CPU alcance el límite máximo, puede ser útil para solucionar el problema antes de que afecte a los clientes.

  • El pilar de fiabilidad define la supervisión y las alertas como indispensables para garantizar el cumplimiento de los requisitos de disponibilidad. La solución de supervisión debe poder detectar los errores de manera eficaz. Cuando detecta problemas o errores, su objetivo principal es alertar sobre esos problemas. La implementación de prácticas continuas de observabilidad y supervisión es imprescindible para las arquitecturas resilientes en la nube. Para mejorar las cargas de trabajo, debe poder medirlas y comprender su estado e integridad. Los principios de diseño para la recuperación automática en caso de error, la escalabilidad horizontal y el aprovisionamiento de capacidad dependen de la precisión de los servicios de supervisión y alerta.

  • El pilar de seguridad analiza la detección y prevención de los cambios de configuración inesperados o no deseados y los comportamientos inesperados. Puede configurar las instancias de base de datos de Amazon RDS para MySQL y MariaDB con el complemento de auditoría de MariaDB para registrar la actividad de la base de datos, como los inicios de sesión de los usuarios y las operaciones concretas que se ejecutan en la base de datos. El complemento almacena el registro de la actividad de la base de datos en un archivo de registro, que se puede integrar e importar a las herramientas de supervisión y alerta. El archivo de registro se analiza en tiempo real para detectar los comportamientos inesperados o sospechosos en la base de datos. Este comportamiento inesperado o sospechoso puede indicar que la instancia de base de datos de Amazon RDS se vio comprometida, lo que indica posibles riesgos para su empresa. Si la herramienta de supervisión detecta un evento de este tipo, activa una alarma para iniciar una respuesta al incidente de seguridad, lo que ayuda a abordar las actividades sospechosas y maliciosas.

Resultados empresariales específicos

La implementación de prácticas recomendadas en los mecanismos de supervisión y alerta ayuda a garantizar una infraestructura de alto rendimiento, resistente, eficiente, segura y con optimización de costos para las aplicaciones y cargas de trabajo. Puede utilizar herramientas de observabilidad que recopilan, almacenan y visualizan métricas, eventos, seguimientos y registros en tiempo real para observar y analizar el panorama general del estado y el rendimiento de las bases de datos y, de este modo, evitar la degradación o la interrupción de los servicios de TI asociados. Si sigue produciéndose una degradación imprevista o una interrupción del servicio, las herramientas de supervisión y alerta ayudan a detectar el problema a tiempo, a escalarlo y a reaccionar, así como a investigar y resolver con rapidez. Una solución integral de supervisión y alertas para las cargas de trabajo de bases de datos en la nube ayuda a lograr los siguientes resultados empresariales:

  • Mejore la experiencia del cliente. Un servicio fiable mejora la experiencia de los clientes. Las bases de datos suelen ser un componente clave de los servicios digitales, como las aplicaciones web y móviles, la transmisión de contenido multimedia, los pagos, las API de empresa a empresa (B2B) y los servicios de integración. Si puede supervisar y configurar alertas en las bases de datos para detectar los problemas de manera rápida, investigarlos de manera eficiente y solucionarlos lo antes posible para minimizar el tiempo de inactividad y otras interrupciones, puede mejorar la disponibilidad, la seguridad y el rendimiento del servicio digital para los clientes.

  • Genere confianza en los clientes.Un mejor rendimiento y una experiencia de usuario más fluida le son útiles para ganarse la confianza de los clientes, lo que puede traducirse en más negocios en su plataforma. Por ejemplo, un proveedor de servicios de procesamiento de pagos que ofrece un servicio confiable por internet puede esperar que los clientes confíen y tengan lealtad en gran medida, lo que se traduce en más clientes y una mejor retención, un aumento de las transacciones facturables y servicios nuevos e innovadores que generan más ingresos.

  • Evite las pérdidas financieras.Los tiempos de inactividad inesperados en la infraestructura de la base de datos pueden afectar a las transacciones comerciales que hacen los clientes con la aplicación. En algunos casos, esto puede provocar pérdidas financieras sustanciales. El incumplimiento de los acuerdos de nivel de servicio (SLA) puede provocar que los clientes pierdan la confianza y, en consecuencia, pierda ingresos. También puede convertirse en una base legal para juicios costosos, en los que los clientes pueden exigir una compensación según los contratos de responsabilidad y garantía. Según un estudio de Atlassian Corporation, una empresa de software, los costos promedio de una interrupción del servicio oscilan entre 140 000 USD y 540 000 USD por hora, según el tipo y el tamaño de la empresa. Un entorno de base de datos estable es clave para evitar interrupciones prolongadas y pérdidas comerciales.

  • Amplíe el valor. Los mecanismos de supervisión y alerta pueden ser útiles para diseñar, desarrollar y operar un servicio digital de alta disponibilidad, resiliente, confiable, eficiente, rentable y seguro, pero esto es solo el comienzo. Querrá que su organización escale y prospere con el tiempo, mejore las cargas de trabajo existentes en la nube e introduzca nuevos servicios. Los nuevos servicios proporcionan un valor adicional a los clientes y más ingresos a la empresa, lo que repercute en el crecimiento de la empresa.

  • Mejore la productividad de los desarrolladores. Los desarrolladores productivos y eficientes, y que no encuentran problemas ni cuellos de botella en sus tareas de desarrollo, pueden ofrecer productos de alta calidad en menos tiempo. Sin embargo, la ingeniería de software y las operaciones de TI suelen enfrentarse a desafíos complejos. Esta complejidad aumenta con la escala de las cargas de trabajo y sus arquitecturas. Para analizar el rendimiento y la coherencia de las aplicaciones distribuidas, los desarrolladores necesitan herramientas que puedan proporcionar métricas y seguimientos correlacionados. Ayudan a identificar los artefactos de código y los componentes de infraestructura defectuosos lo más rápido posible, y ayudan a determinar los impactos en los usuarios finales. El conjunto adecuado de herramientas de supervisión y alerta puede ayudar a los desarrolladores a programar y probar mejor y más rápido.

  • Mejore la eficacia y la eficiencia operativas.Al operar las cargas de trabajo en la nube a escala, incluso un pequeño porcentaje de las mejoras de rendimiento puede suponer un ahorro de millones de dólares. Al supervisar las bases de datos y analizar las métricas, los eventos, los registros y los seguimientos, puede comprender y predecir sus necesidades de capacidad futuras y aprovechar los ahorros de costos disponibles en la Nube de AWS. Comprender las cargas de trabajo y el estado operativo de Amazon RDS puede ayudar a responder a los eventos, solucionar los problemas y planificar las mejoras.