監控 MediaTailor CDN 操作和效能 - AWS Elemental MediaTailor

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

監控 MediaTailor CDN 操作和效能

有效監控您的 AWS Elemental MediaTailor 和內容交付網路 (CDN) 整合,可確保可靠的內容交付、最佳效能和快速問題偵測。此監控方法適用於所有 MediaTailor 實作,包括伺服器端廣告插入 (SSAI)、頻道組合和合併工作流程。

監控 CDN 整合可讓您:

  • 在問題影響瀏覽者之前偵測並解決問題

  • 追蹤關鍵效能指標並維護服務品質

  • 維持最佳快取效能並減少原始伺服器負載

  • 確保廣告插入成功率符合業務需求

基本 CDN 效能指標

追蹤這些核心指標,以使用 MediaTailor 實作評估 CDN 的有效性:

快取命中率

它測量的項目:從 CDN 快取與從原始伺服器提供的請求百分比。

目標值

  • 內容區段:95% 或更高的快取命中率

  • 廣告客群:90% 或更高的快取命中率

  • 資訊清單:依實作而異 (不應快取個人化資訊清單)

為什麼重要:較高的快取命中率可減少原始伺服器負載、改善回應時間,以及降低頻寬成本。

原始請求磁碟區

它測量的項目:到達 MediaTailor 原始伺服器的請求數量。

目標模式:應保持低且穩定,偶爾快取遺漏或新內容尖峰。

為什麼重要:高原始伺服器請求磁碟區表示快取效率低下,並可能影響 MediaTailor 效能。

回應延遲

它測量的項目:CDN 回應瀏覽者請求的速度。

目標值

  • 快取內容:小於 100 毫秒 (P95)

  • 原始請求:小於 500 毫秒 (P95)

  • 資訊清單請求:小於 100 毫秒 (P95)

  • 區段請求:小於 50ms (P95)

為什麼重要:低延遲可確保順暢播放和良好的觀眾體驗。

錯誤率

它測量的項目:導致 HTTP 錯誤的請求百分比。

目標值

  • 4xx 錯誤:低於請求總數的 0.1%

  • 5xx 錯誤:低於請求總數的 0.01%

  • 原始伺服器錯誤:低於原始伺服器請求的 0.05%

為什麼重要:高錯誤率表示會影響瀏覽者體驗的組態問題或服務問題。

MediaTailor 特定指標

監控這些 MediaTailor 指標與 CDN 指標,以獲得完整的可見性:

廣告填滿率

關鍵指標Avail.FillRateAdDecisionServer.FillRate

目標值:兩個指標都高於 90%

為什麼重要:直接影響廣告收入和觀眾體驗

資訊清單產生效能

關鍵指標GetManifest.LatencyGetManifest.Errors

目標值:延遲低於 200 毫秒,錯誤率低於 1%

為什麼重要:影響播放啟動時間和可靠性

廣告決策伺服器運作狀態

關鍵指標AdDecisionServer.ErrorsAdDecisionServer.LatencyAdDecisionServer.Timeouts

目標值:延遲低於 1000 毫秒、錯誤率低於 5%、最小逾時

為什麼重要:ADS 效能直接影響廣告插入成功

設定監控工具

設定這些工具以有效監控 MediaTailor 和 CDN 整合:

Amazon CloudWatch 整合

Amazon CloudWatch 提供監控 MediaTailor 和 CDN 整合的基礎:

MediaTailor 指標

MediaTailor 會自動將指標發佈至 CloudWatch,以追蹤請求、回應和錯誤。關鍵指標包括:

  • RequestCount:MediaTailor 的請求總數

  • ResponseTime:MediaTailor 回應延遲

  • 4xxErrorCount5xxErrorCount:錯誤追蹤

如需 MediaTailor 指標的完整清單,請參閱 AWS Elemental MediaTailor 使用 Amazon CloudWatch 指標進行監控

CDN 指標

在 CloudWatch 中啟用 CDN 指標集合,包括:

  • 快取不同內容類型的命中率

  • 原始請求計數和回應時間

  • 依狀態碼的錯誤率

對於 CloudFront 特定指標,請在分佈設定中啟用詳細監控。

儀表板組態

建立儀表板來提供 MediaTailor 和 CDN 效能的可見性:

  1. 建立統一儀表板:在單一 CloudWatch 儀表板中結合 MediaTailor 和 CDN 指標,以獲得完整的可見性。

  2. 依工作流程組織:依實作類型 (SSAI、頻道組合或合併工作流程) 分組指標。

  3. 包含關鍵績效指標

    • 隨著時間的推移快取命中率趨勢

    • 回應延遲百分位數 (P50、P95, P99)

    • 錯誤率趨勢和峰值

如需詳細儀表板建立指引,請參閱 CloudWatch 儀表板

警示組態

設定警示以在問題影響瀏覽者之前偵測問題:

關鍵警示

針對嚴重問題設定立即提醒:

  • 高錯誤率:當 5xx 錯誤在 5 分鐘內超過 0.1% 的請求時發出提醒

  • 原始伺服器問題:原始伺服器回應時間超過 2 秒時發出警示

  • 快取命中率下降:當資訊清單的快取命中率低於 70% 或區段的 85% 時發出警示

警告提醒

設定效能降低的早期警告警示:

  • 延遲增加:P95 回應時間超過 200 毫秒時發出警示

  • 快取效率下降:當區段的快取命中率低於 90% 時發出警示

實作檢查清單

使用此檢查清單來確保全面的監控涵蓋範圍:

  1. 指標集合

    • ✓ 在 CloudWatch 中啟用 MediaTailor 指標

    • ✓ 已啟用 CDN 詳細監控

  2. 儀表板設定

    • ✓ 已建立統一 CloudWatch 儀表板

    • ✓ 使用適當的時間範圍視覺化的關鍵指標

    • ✓ 與相關團隊共用的儀表板

  3. 警示組態

    • ✓ 使用立即通知設定的關鍵警示

    • ✓ 警示設定為早期偵測

    • ✓ 警示呈報程序已記錄

  4. 操作程序

    • ✓ 記錄的事件回應程序

    • ✓ 建立定期審查排程

    • ✓ 團隊訓練已完成

如需特定監控案例的其他指引: