View a markdown version of this page

OPS04-BP04 Implementar telemetría de dependencias - AWS Well-Architected Framework

OPS04-BP04 Implementar telemetría de dependencias

Diseñe y configure la carga de trabajo para emitir información sobre el estado de los recursos de los que depende. Se trata de recursos externos a su carga de trabajo. Entre los ejemplos de dependencias externas se pueden incluir las bases de datos externas, el DNS y la conectividad de la red. Utilice esta información para determinar cuándo se requiere una respuesta y proporcionar un contexto adicional sobre el estado de la carga de trabajo.

Resultado deseado:

  • Su carga de trabajo emite telemetría sobre el estado de las dependencias externas.

  • Se le notifica cuando las dependencias no son adecuadas.

Patrones comunes de uso no recomendados:

  • Sus usuarios no pueden acceder a su sitio. No puede determinar si el motivo es un problema de DNS, sin realizar manualmente una comprobación para ver si su proveedor de DNS está operativo.

  • Su aplicación de carro de compra no puede completar las transacciones. No puede determinar si se trata de un problema con su proveedor de procesamiento de tarjetas de crédito sin ponerse en contacto con ellos para verificarlo.

Beneficios de establecer esta práctica recomendada:

  • La supervisión de las dependencias externas permite anticiparse a los problemas.

  • El conocimiento del estado de sus dependencias contribuye a la resolución de problemas.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

Colabore con las partes interesadas para identificar las dependencias externas de su carga de trabajo. Las dependencias externas pueden incluir bases de datos externas, API o conectividad de red entre su carga de trabajo y los recursos de otros entornos. Desarrolle una estrategia de supervisión para conocer el estado de las dependencias y dar la alarma de forma proactiva si cambia el estado.

Ejemplo de cliente

La carga de trabajo de comercio electrónico de AnyCompany Retail depende de una base de datos que se encuentra en otro entorno. Cada noche, los datos se incorporan a la base de datos para utilizarse en la plataforma de comercio electrónico. La conectividad a la red y la compatibilidad de base de datos pertenecen a otros equipos. El equipo de comercio electrónico configuró varias alarmas de valor controlado para alertarles cuando la conectividad de la red cae, la base de datos no está accesible y cuando el trabajo no se completa.

Pasos para la implementación

  1. Identifique las dependencias externas de su carga de trabajo. Implemente la telemetría para hacer un seguimiento del estado o la accesibilidad de las dependencias.

    1. Los clientes de AWS pueden utilizar Panel de AWS Health para supervisar el estado de los servicios de AWS y recibir notificaciones de eventos de estado.

    2. Amazon CloudWatch Synthetics se puede utilizar para supervisar API, URL y contenido de sitios web.

  2. Configure alertas para notificar a su organización cuando el estado de una dependencia sea incorrecto o esté inaccesible.

    1. Los clientes con Enterprise Support pueden solicitar un taller de creación de una estrategia de supervisión de su administrador técnico de cuentas. Este taller le ayudará a desarrollar una estrategia de observabilidad para su carga de trabajo.

  3. Identifique los contactos para las dependencias en los casos en los que el estado de la dependencia no sea correcto. Documente cómo contactar con el propietario de la dependencia, los acuerdos de servicio y el proceso de escalamiento.

Nivel de esfuerzo para el plan de implementación: medio. La implementación de la telemetría de dependencias puede requerir crear soluciones de supervisión personalizadas.

Recursos

Prácticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados:

Servicios relacionados: