CDN と MediaTailor の統合のモニタリングとスケーリングを設定する - AWS Elemental MediaTailor

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CDN と MediaTailor の統合のモニタリングとスケーリングを設定する

AWS Elemental MediaTailor コンテンツ配信ネットワーク (CDN) 統合で最適なパフォーマンスと視聴者エクスペリエンスを維持するには、効果的なモニタリングとスケーリング戦略が不可欠です。CDN 統合が大規模に確実に実行されるように、これらのアプローチを実装します。

以下のモニタリングおよびスケーリング戦略を実装します。

  1. これらの主要メトリクスのモニタリングを設定します。適切なターゲット値に関するガイダンスについては、Amazon CloudWatch による MediaTailor のモニタリング」および「CDN プロバイダーのベストプラクティス」を参照してください。

    • CDN キャッシュヒット率 (コンテンツタイプと配信パターンに基づいてベースラインメトリクスとターゲットを確立する)

    • オリジンリクエストボリューム (異常検出のベースラインを確立するために、通常のオペレーション中にパターンをモニタリングする)

    • エラータイプ別のエラー率 (サービスレベル目標と MediaTailor のベストプラクティスに基づいてしきい値を定義する)

    • 応答時間 (ビューワーエクスペリエンスの要件と地理的分布に基づいて適切なレイテンシーターゲットを設定する)

    実装手順の詳細については、「MediaTailor と CDN メトリクスを一緒に視覚化する CloudWatch ダッシュボードの作成」を参照してください。 MediaTailor

  2. 予期しないトラフィックパターンやパフォーマンスの低下に関するアラートを設定します。ベースラインメトリクスとサービスレベルの目標に基づいてしきい値を設定します。アラートの設定に関するガイダンスについては、Amazon CloudWatch アラームの作成」を参照してください。モニタリングを検討してください。

    • ベースラインキャッシュヒット率からの大幅な偏差 (通常は 85~90% を下回ると警告)

    • オリジンリクエスト量の急激な増加 (ベースラインから 30% 以上の増加を警告)

    • 定義されたしきい値を超えるエラー率の急増 (通常は 4xx エラーの場合は 1~2%、5xx エラーの場合は 0.5%)

    • 許容レベルを超える応答時間の低下 (通常はマニフェストの場合は >500 ミリ秒、セグメントの場合は >200 ミリ秒)

    実装例については、効果的なモニタリングダッシュボードとアラートを作成するための CloudWatch の概念を参照してください。

  3. 予測可能なトラフィックの多いイベントのスケーリングプランを作成します。計画には、次の主要な要素を含める必要があります。

    • イベント前のキャパシティーの増加 (イベント開始の 24~48 時間前)

    • 段階的な視聴者ランプアップスケジュール (通常、5 分間隔で予想される視聴者の 10~20%)

    • 対象者に基づくリージョン別キャパシティー分布 (予想されるリージョン別視聴率に比例してキャパシティーを割り当てる)

    • イベント後のスケーリング手順 (イベント終了後 30~60 分間ピーク容量を維持する)

    トラフィックの多いイベントのスケーリングに関する実装ガイダンスについては、 AWS メディアブログの「回復力のあるend-to-endのライブワークフローのセットアップ」を参照してください。

  4. 次のような重要なストリームのフェイルオーバーと冗長性対策を実装します。

    • マルチリージョン CDN デプロイ (重要なコンテンツの場合は少なくとも 2 つのリージョン)

    • バックアップオリジンサーバー (30 秒ごとに自動ヘルスチェックで設定)

    • ヘルスチェックに基づく自動フェイルオーバートリガー (通常はチェックが 2~3 回失敗した後)

    • さまざまな障害シナリオの復旧手順 (特定の応答時間目標で文書化)

    詳細な実装手順については、CloudFront オリジンフェイルオーバーによる高可用性の最適化」を参照してください。