Configure la supervisión y el escalado de la CDN y las integraciones MediaTailor - AWS Elemental MediaTailor

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configure la supervisión y el escalado de la CDN y las integraciones MediaTailor

Las estrategias eficaces de supervisión y escalado son fundamentales para mantener un rendimiento y una experiencia de visualización óptimos con la integración de la red de entrega de AWS Elemental MediaTailor contenido (CDN). Implemente estos enfoques para garantizar que su integración de CDN funcione de forma fiable a escala.

Implemente las siguientes estrategias de monitoreo y escalado:

  1. Configure la supervisión de estas métricas clave. Para obtener orientación sobre los valores objetivo adecuados, consulta Monitoring MediaTailor with Amazon CloudWatch y consulta las mejores prácticas de tu proveedor de CDN:

    • Índices de aciertos de la caché de la CDN (establece métricas y objetivos de referencia en función del tipo de contenido y los patrones de entrega)

    • Volúmenes de solicitudes de origen (monitorea los patrones durante el funcionamiento normal para establecer puntos de referencia para la detección de anomalías)

    • Tasas de error por tipo de error (defina los umbrales en función de los objetivos de nivel de servicio y las mejores prácticas) MediaTailor

    • Tiempos de respuesta (establece los objetivos de latencia adecuados en función de los requisitos de experiencia del espectador y de la distribución geográfica)

    Para obtener instrucciones de implementación detalladas, consulta Cómo crear CloudWatch paneles para visualizar tus métricas MediaTailor y las de la CDN juntas.

  2. Configura alertas para detectar patrones de tráfico inesperados o una degradación del rendimiento. Configure los umbrales en función de sus métricas de referencia y sus objetivos de nivel de servicio. Para obtener información sobre cómo configurar alertas, consulta Cómo crear CloudWatch alarmas de Amazon. Considera la posibilidad de monitorizar:

    • Desviaciones significativas con respecto a las tasas de aciertos de la memoria caché de referencia (normalmente se alerta cuando se sitúan por debajo del 85-90%)

    • Aumentos repentinos en el volumen de solicitudes de origen (alerta si hay un aumento del 30% o más con respecto al valor de referencia)

    • Los picos de la tasa de error superan los umbrales definidos (normalmente del 1 al 2% en el caso de los errores de 4 xx y del 0,5% en los de 5 xx)

    • Degradación del tiempo de respuesta por encima de los niveles aceptables (normalmente >500 ms para los manifiestos, >200 ms para los segmentos)

    Para ver ejemplos de implementación, consulte CloudWatch los conceptos para crear paneles y alertas de monitoreo efectivos.

  3. Cree planes de escalado para eventos predecibles de alto tráfico. Sus planes deben incluir los siguientes elementos clave:

    • La capacidad previa al evento aumenta (24 a 48 horas antes del inicio del evento)

    • Incremento gradual de los horarios de audiencia (normalmente entre un 10 y un 20% de la audiencia prevista en cada intervalo de 5 minutos)

    • Distribución de la capacidad regional en función de la audiencia (asigne la capacidad proporcionalmente a la audiencia regional esperada)

    • Procedimientos de escalado posteriores al evento (mantener la capacidad máxima durante 30 a 60 minutos después de la finalización del evento)

    Para obtener instrucciones de implementación sobre el escalado para eventos de alto tráfico, consulte Cómo configurar un flujo de trabajo end-to-end en vivo resiliente en el AWS blog multimedia.

  4. Implemente medidas de conmutación por error y redundancia para las transmisiones críticas, que incluyen:

    • Implementaciones de CDN en varias regiones (al menos dos regiones para el contenido crítico)

    • Servidores de origen de Backup (configurados con controles de estado automatizados cada 30 segundos)

    • La conmutación por error automática se activa en función de las comprobaciones de estado (normalmente después de 2 o 3 comprobaciones fallidas)

    • Procedimientos de recuperación para diferentes escenarios de fallo (documentados con objetivos de tiempo de respuesta específicos)

    Para ver los pasos de implementación detallados, consulte Optimización de la alta disponibilidad con la conmutación por error de CloudFront Origin.