Prácticas recomendadas generales - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Prácticas recomendadas generales

Las siguientes prácticas recomendadas son útiles para obtener una visibilidad suficiente del estado de la carga de trabajo de Amazon RDS y a tomar las medidas adecuadas en respuesta a los eventos operativos y los datos de supervisión.

  • Identifique los KPI. Identifique los indicadores clave de rendimiento (KPI) según los resultados empresariales deseados. Evalúe los KPI para determinar los buenos resultados de la carga de trabajo. Por ejemplo, si su actividad principal es el comercio electrónico, uno de los resultados empresariales esperados podría ser que su tienda electrónica esté disponible de manera ininterrumpida para que sus clientes puedan comprar. Para lograr ese resultado empresarial, debe definir el KPI de disponibilidad para la base de datos backend de Amazon RDS que utiliza la aplicación de su tienda electrónica y establecer el KPI de la línea de base en el 99,99 % semanalmente. La evaluación del KPI de disponibilidad real con respecto al valor de la línea de base es útil para determinar si cumple con la disponibilidad deseada de la base de datos del 99,99 % y, por lo tanto, a lograr el resultado empresarial de contar con un servicio ininterrumpido.

  • Defina las métricas de carga de trabajo. Defina las métricas de carga de trabajo para medir las cantidades y calidades de la carga de trabajo de Amazon RDS. Evalúe las métricas para determinar si la carga de trabajo está logrando los resultados deseados y para comprender su estado. Por ejemplo, para evaluar el KPI de disponibilidad de la instancia de bases de datos de Amazon RDS, debe medir métricas como el tiempo de actividad y el tiempo de inactividad de la instancia de bases de datos. A continuación, puede utilizar esas métricas para calcular el KPI de disponibilidad de la siguiente manera:

    availability = uptime / (uptime + downtime)

    Las métricas representan conjuntos de puntos de datos ordenados por tiempo. Las métricas también pueden incluir dimensiones. Estas son útiles en la categorización y el análisis.

  • Recopile y analice las métricas de la carga de trabajo. Amazon RDS genera diferentes métricas y registros según la configuración. Algunos de estos representan eventos de instancias de bases de datos, contadores o estadísticas, como db.Cache.innoDB_buffer_pool_hits. Otras métricas provienen del sistema operativo, por ejemplo memory.Total, que mide la cantidad total de memoria de la instancia de Amazon Elastic Compute Cloud (Amazon EC2) del host. La herramienta de supervisión debe hacer un análisis periódico y proactivo de las métricas recopiladas para identificar las tendencias y determinar si se necesitan respuestas adecuadas.

  • Establezca líneas de base para las métricas de carga de trabajo. Establezca las líneas de base para las métricas a fin de definir los valores esperados e identificar los umbrales correctos o incorrectos. Por ejemplo, podría definir que la línea de base para ReadIOPS sea de hasta 1000 en operaciones normales de base de datos. A continuación, puede utilizar esta línea de base para comparar e identificar el sobreúso. Si las nuevas métricas muestran de manera coherente que las IOPS leídas oscilan entre 2000 y 3000, habrá identificado una desviación que podría provocar una respuesta que permitiera investigar, intervenir y mejorar.

  • Alerte cuando los resultados de la carga de trabajo estén en riesgo. Cuando determine que el resultado empresarial está en riesgo, emita una alerta. A continuación, puede abordar los problemas de forma proactiva, antes de que afecten a los clientes, o mitigar el impacto del incidente de manera oportuna.

  • Identifique los patrones de actividad esperados para la carga de trabajo. Según las métricas de la línea de base, establezca los patrones de la actividad de la carga de trabajo para identificar comportamientos inesperados y responder con las acciones adecuadas, si es necesario. AWS proporciona herramientas de supervisión que aplican algoritmos estadísticos y de machine learning para analizar las métricas y detectar las anomalías.

  • Alerte cuando se detecten anomalías de la carga de trabajo. Cuando se detecten las anomalías en las operaciones de las cargas de trabajo de Amazon RDS, emita una alerta para que pueda responder con las medidas adecuadas si es necesario.

  • Evalúe y revise los KPI y las métricas. Confirme que las bases de datos de Amazon RDS cumplen los requisitos definidos e identifique las áreas de posibles mejoras para alcanzar sus objetivos empresariales. Valide la eficacia de las métricas medidas y los KPI evaluados. Revíselos si es necesario. Por ejemplo, supongamos que establece un KPI para el número óptimo de conexiones simultáneas a bases de datos y que supervisa las métricas relacionadas con las conexiones intentadas y erróneas, así como los procesos de usuarios que se crearon y están en ejecución. Es posible que tenga más conexiones a bases de datos que las definidas en la línea de base del KPI. Al analizar las métricas actuales, puede detectar el resultado, pero es posible que no pueda determinar la causa de origen. Si es así, debe revisar las métricas e incluir otras medidas de supervisión, como contadores para bloquear las tablas. Las nuevas métricas ayudarían a determinar si el aumento del número de conexiones a la base de datos se debe a bloqueos de tablas inesperados.