信頼性の柱 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

信頼性の柱

AWS Well-Architected フレームワークの信頼性の柱は、システムが意図した機能とパフォーマンスレベルを、その存続期間を通じて期待される運用期間中にどの程度維持しているかに対処します。ワークロードライフサイクルのすべての段階でテストと検証の戦略など AWS、 で信頼性の高いシステムを構築および維持するための包括的なガイドラインを提供します。

この柱を WorkSpaces アプリケーションストリーミング環境に適用するための主な重点領域:

  • フリートの管理とスケーリング

  • セッションの信頼性

  • アプリケーションの可用性

  • 復旧手順

障害から自動的に復旧する

ビジネス価値KPIs をモニタリングして、障害がオペレーションに影響を与える前に障害を予測、防止、または復旧できる自動応答をトリガーします。

  • IP サブネットを割り当てる際には、拡張性と可用性を考慮するようにします。

  • 重要な CloudWatch メトリクスをモニタリングして、 や などのフリート容量メトリクスAvailableCapacity、 などのストリーミング品質メトリクスなどInUseCapacity、サービスの可用性とパフォーマンスを確保しますStreamingSessionLatency

  • キャパシティのしきい値、セッションヘルスメトリクス、パフォーマンスの低下、フリートのヘルスステータスの変更に関するアラートを設定します。

  • 組み込み WorkSpaces アプリケーションの自動スケーリング機能を使用して、次のことを行います。

    • 最小および最大フリート容量を設定します。

    • 容量使用率に基づいてスケーリングポリシーを設定します。

    • 技術的なメトリクスだけでなく、ユーザーエクスペリエンスメトリクスとビジネス要件に基づいてスケールアウトとスケールインのしきい値を定義します。

  • WorkSpaces アプリケーション環境のディザスタリカバリ環境を構築します。詳細については、 AWS ブログ記事Amazon WorkSpaces アプリケーションのディザスタリカバリに関する考慮事項」を参照してください。

復旧手順をテストする

クラウド環境により、障害シナリオと復旧手順の自動テストが可能になります。これらの機能は、実際の障害が発生する前に脆弱性を特定して修正するのに役立ちます。

  • フリート復旧テスト。複数のシナリオにわたって包括的なフリート復旧テストを実装します。

    • インスタンスの終了をシミュレートして、自動スケーリングレスポンスを検証します。

    • フリートの最小容量のメンテナンスを検証します。

    • インスタンスの置き換えタイミングとユーザーリダイレクトをテストします。

    • スケーリングポリシーの有効性を検証します。

    • フリートの容量制限とオーバーフロー処理をテストします。

  • セッション復旧テスト。セッション復旧の検証手順を実装します。

    • 切断と再接続のシナリオをテストします。

    • アプリケーションの状態の保存を確認します。

    • さまざまなネットワーク中断シナリオをテストします。

    • セッションタイムアウトの動作を検証します。

    • ユーザー認証の永続性を検証します。

    • 一時的なストレージ処理を確認します。

ワークロードの全体的な可用性を高めるために水平方向にスケールする

ワークロードを複数の小規模なリソースに分散して、個々の障害の影響を最小限に抑え、単一障害点を排除します。

容量の推測を停止する

クラウドの自動スケーリング機能を使用して、需要に基づいてリソースを動的に調整します。これにより、最適な効率を維持しながら、リソースの飽和を防ぐことができます。

  • CapacityUtilization、、 などの主要なメトリクスをモニタリングInUseCapacityしてAvailableCapacity、容量のニーズを把握します。

  • さまざまな期間におけるフリート使用率の傾向を追跡します。毎日のパターン、毎週のバリエーション、毎月の傾向、季節的なピークをモニタリングします。

  • スケーリングポリシーを設定し、スケーリングしきい値を設定します。

  • フェイルオーバーを行える十分な最大使用量に配慮して、現在のクォータが設定されていることを確認します。

  • アーキテクチャ全体で、固定のサービスクォータおよび制約に対応します。

自動化による変更の管理

自動化コード自体のバージョン管理された変更を含む、自動化によるインフラストラクチャの変更を実装します。

  • フリート設定には IaC を使用します。

  • 一貫したスケーリングポリシーを実装します。

  • Image Assistant CLI を使用して、一貫したイメージを作成します。