運用上の優秀性の柱 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

運用上の優秀性の柱

運用上の優秀性 (OE) は、ユーザーの期待に一貫して応え、それを超える高品質のソフトウェアソリューションを作成することに専念しています。 AWS Well-Architected フレームワークの運用上の優秀性の柱には、効果的なチーム組織、堅牢なワークロード設計、効率的な大規模な運用、時間の経過とともに変化する要件へのシームレスな適応のための実証済みの戦略が含まれています。これらの原則に従うことで、組織はシステムの耐障害性、パフォーマンス、進化するビジネスニーズとの整合性を維持できます。

この柱を WorkSpaces アプリケーションストリーミング環境に適用するための主な重点領域:

  • モニタリングとオブザーバビリティ

  • 自動化と DevOps

  • 運用手順とドキュメント

  • サポートとインシデント管理

ビジネス成果に関するチームを編成する

ビジネス目標と主要業績評価指標 (KPIs) が最適化された人材、プロセス、テクノロジーを通じて組織の変革を促進する、強力なリーダーシップコミットメントを持つクラウドに沿った運用モデルを作成します。

  • チーム構造。アプリケーションストリーミングの結果に沿った専用チームを確立します。例:

    • イメージ管理チームは、アプリケーションのパッケージングとイメージの最適化を担当します。

    • フリート運用チームは、容量、パフォーマンス、スケーリングを管理します。

    • ユーザーエクスペリエンスチームは、エンドユーザーのサポートと満足度を処理します。

  • KPIsとメトリクス。次のようなビジネスに沿ったメトリクスを定義して追跡します。

    • アプリケーションの可用性レート

    • 新しいアプリケーションをデプロイする時間

    • アプリケーションストリーミング時間あたりのコスト

  • 運用モデル。以下の明確なプロセスを作成します。

    • アプリケーションのオンボーディングと更新

    • フリート容量管理

    • ユーザーアクセスのプロビジョニング

    • インシデント対応と解決

実用的なインサイトのためのオブザーバビリティを実装する

包括的なモニタリングとオブザーバビリティを実装して、KPIs。この原則により、データ駆動型の意思決定が可能になり、パフォーマンス、信頼性、コストにわたってプロアクティブな改善が可能になります。

可能な限り安全に自動化する

Infrastructure as Code (IaC) の原則を適用して、ワークロードオペレーションのあらゆる側面を自動化します。ガードレールを使用すると、手動による介入を減らしながら、安全で一貫した実行を確保できます。

  • Image Assistant CLI を使用して、WorkSpaces アプリケーションイメージの作成と設定を自動化します。詳細については、WorkSpaces Applications ドキュメントの「Image Assistant CLI オペレーションを使用してプログラムで Amazon WorkSpaces アプリケーションイメージを作成する」を参照してください。 WorkSpaces

    • アプリケーションのインストール: Image Assistant CLI を使用して、イメージの作成中にアプリケーションのインストールを自動化します。

    • イメージの作成: Image Assistant CLI コマンドを使用して、プログラムで WorkSpaces アプリケーションイメージを作成します。

    • 設定管理: デフォルトのアプリケーション設定と起動パラメータの設定を自動化します。

  • WorkSpaces Applications イメージのカスタマイズを自動化します。詳細については、 AWS ブログ記事「カスタマイズされた WorkSpaces Applications Windows イメージを自動的に作成する」を参照してください。

  • IaC を適用して、WorkSpaces アプリケーションのインフラストラクチャとアプリケーションコンポーネントをデプロイします。詳細については、 AWS ブログ記事「Automation of infrastructure and application deployment for Amazon WorkSpaces Applications with Terraform」を参照してください。

  • 以下を含むフリート管理の自動プロセスを実装します。

    • 需要に基づくフリートスケーリング。自動スケーリングポリシーを設定して、使用率メトリクスに基づいてフリート容量を自動的に調整します。詳細については、 AWS ブログ記事「Use AWS Lambda to adjust scaling steps and thresholds for Amazon WorkSpaces Applications」を参照してください。

    • ベースイメージの更新。が提供する WorkSpaces Applications ベースイメージの自動更新を利用できます AWS。

    • 容量の最適化。自動スケーリングしきい値を設定して、需要パターンに基づいてリソース使用量を最適化します。

  • 安全制御を自動化するようにガードレールを設定します。

    • 最大フリートサイズ制限。過剰プロビジョニングを防ぐために、フリート容量の上限を設定します。

    • スケーリングポリシーの設定。適切なしきい値を使用して、ステップスケーリングまたはターゲット追跡スケーリングポリシーを実装します。

    • サービスクォータ。 AWS 過剰なリソース割り当てを防ぐために、サービスクォータを組み込みの制限として使用します。

    • スケールイン保護。スケールイン保護を設定して、スケーリングイベント中にアクティブなインスタンスが削除されないようにします。

  • Image Builder、フリート、統合テストなど、テストと検証を実行します。

    • Image Builder のテスト:

      • Image Builder インターフェイスで直接アプリケーションをテストします。

      • アプリケーションの起動と機能を確認します。

      • ユーザー設定と設定をテストします。

      • アプリケーションの互換性を検証します。

    • フリートテスト:

      • さまざまなクライアントデバイスからストリーミングセッションをテストします。

      • ユーザーの使用権限とアクセスを確認します。

      • アプリケーションのパフォーマンスを検証します。

      • クリップボード、ファイル転送、印刷などの要素とオペレーションのユーザーエクスペリエンスをテストします。

    • 統合テスト:

      • Active Directory または SAML 2.0 ベースの認証をテストします。

      • ホームフォルダと永続的ストレージをテストします。

      • アプリケーションのエンタイトルメントをテストします。

      • USB デバイスリダイレクトをテストします (設定されている場合)。

  • WorkSpaces アプリケーションマネージャーを使用して、アプリケーションのパッケージ化とデプロイを自動化します。詳細については、 AWS ブログ記事Amazon WorkSpaces Applications のアプリケーションマネージャーによるアプリケーションのオンボーディングを効率化する」を参照してください。

  • 継続的インテグレーションと継続的デリバリー (CI/CD) パイプラインを使用して、新しいアプリケーションバージョンのデプロイを自動化します。詳細については、 AWS ブログ記事「Eagle: Optimize CI/CD and end user experience in Amazon WorkSpaces Applications」を参照してください。

頻繁で小さく、可逆的な変更を行う

最小限のリスクと簡単なロールバック機能で、頻繁で小規模な自動デプロイを可能にする、疎結合でスケーラブルなワークロードを構築します。

  • イメージの更新には、バージョニングされたイメージの作成と増分更新を使用します。

    • バージョニングされたイメージの作成:

      • Image Builder を使用して、変更のセットごとに新しいイメージを作成します。

      • ロールバックシナリオをサポートするために、複数のイメージバージョンを維持します。

      • AWS タグ付け戦略を使用して、イメージのバージョンと属性を追跡します。

    • 増分更新:

      • アプリケーションまたは設定に小さな増分変更を加えます。

      • 新しいイメージを作成する前に、Image Builder で更新を徹底的にテストします。

      • 各新しいイメージバージョンで行ったすべての変更を文書化します。

  • コントロールフリートの更新の場合:

    • テスト用に更新されたイメージを使用して新しいフリートを作成します。

    • アクティブなセッションを中断することなく、既存のフリート属性を変更します。

  • ドキュメント、テストプロトコル、承認ワークフロー、モニタリングプロセスに関する変更管理手順を確立します。

    • ドキュメント:

      • すべてのイメージとフリートの更新の詳細な変更ログを維持します。

      • 各変更のテスト手順と結果を文書化します。

      • AWS CloudTrail を使用して、設定の変更を追跡および監査します。

    • プロトコルのテスト:

      • すべての変更に対して包括的なテストプロセスを確立します。

      • アプリケーションの機能、パフォーマンス、ユーザーエクスペリエンステストを含めます。

      • 新しいイメージを作成する前に、Image Builder でテストを実行します。

      • フルデプロイの前に、非本番稼働フリートで追加のテストを実行します。

    • 承認ワークフロー:

      • 本番環境への変更の承認プロセスを実装します。

      • 承認と標準の更新を必要とする変更の基準を定義します。

      • 変更承認の役割と責任を確立します。

    • モニタリングと検証:

      • Amazon CloudWatch を使用して、変更後のフリートとアプリケーションのパフォーマンスをモニタリングします。

      • 主要メトリクスのアラートを設定して、更新後に問題をすばやく特定します。

      • 実装後のレビューを実施して、変更の成功を検証し、学習情報を収集します。

オペレーション手順を頻繁に絞り込む

定期的なレビュー、更新、チームエンゲージメントを通じて運用手順を継続的に改善し、すべてのステークホルダーに最新情報を提供し、ベストプラクティスに合致させます。

  • ドキュメント管理。WorkSpaces Applications の手順に関するバージョン管理された最新のドキュメントを一元管理し、運用上の一貫性とチーム間の知識共有を確保します。

    • 必要なドキュメント: イメージの作成と管理、フリートオペレーション、トラブルシューティングのための重要な WorkSpaces アプリケーションオペレーションに関するup-to-dateドキュメントを維持します。

    • 運用レビュー: パフォーマンスメトリクスやインシデント管理など、主要な運用面を監視およびレビューします。

  • 継続的な改善。 AWS のサービス 更新、運用メトリクス、学習したベストプラクティスを標準手順に組み込むことで、WorkSpaces アプリケーションの運用を体系的に強化します。

    • サービスの更新: WorkSpaces アプリケーションのリリースノートをモニタリングして、新機能、サービスの改善、セキュリティの更新、リージョンの可用性を確認します。

    • ベストプラクティス: AWS Well-Architected Framework の更新、WorkSpaces アプリケーションのベストプラクティス、 AWS リファレンスアーキテクチャ、および AWS セキュリティの推奨事項を確認して組み込みます。

    • ナレッジ管理: 標準運用手順、ランブック、トラブルシューティングガイド、およびユーザーサポートドキュメントを維持および更新します。

失敗を予測する

障害シナリオテストを定期的に実施して、リスクを理解し、対応手順を検証し、実際のインシデントを処理するためのチームの準備状況を向上させます。

  • 失敗テスト。フリート容量の枯渇、アプリケーションの起動障害、ネットワーク接続の問題などの障害を定期的にシミュレートしてテストします。

    • フリート容量の枯渇:

      • 容量制限に近づいたときのフリートスケーリング動作をモニタリングしてテストします。

      • CapacityUtilization および AvailableCapacityメトリクスの CloudWatch アラームを設定します。

      • ピーク時の使用時に容量の制約を処理する手順を実装します。

    • アプリケーション起動の失敗:

      • ストリーミングインスタンスでアプリケーションの起動動作をテストします。

      • さまざまなフリート設定でアプリケーションアクセスとパフォーマンスを検証します。

    • ネットワーク接続の問題:

      • さまざまなネットワーク条件でストリーミングセッションのパフォーマンスをテストします。

      • 接続品質の問題StreamingSessionLatencyを監視します。

      • VPC 設定とセキュリティグループが適切に設定されていることを確認します。

  • 復旧手順。以下の手順を開発してテストします。

    • 間のフリートフェイルオーバー AWS アベイラビリティーゾーン。さらに、フリート容量のスケーリング、フリートの更新の管理、インスタンスのヘルス問題への対応の手順を文書化します。

    • ユーザーデータ管理:

      • Windows フリートの場合は Amazon Simple Storage Service (Amazon S3) のホームフォルダのアプリケーション設定の永続性とストレージソリューションを設定し、Linux フリートの場合は Amazon Elastic File System (Amazon EFS) の共有ファイルシステムを設定します。

      • セッション間のデータ同期を検証します。

    • サービスの継続性。新しいフリートインスタンスの作成、イメージの更新の管理、セッションの切断の処理の手順を維持します。

  • リスク管理。以下を特定して軽減します。

    • 適切なフリート最小容量の設定、需要パターンに基づく自動スケーリングポリシーの設定、CapacityUtilization、、 などの CloudWatch メトリクスを使用したフリート使用率の傾向のモニタリングによる容量の制約InUseCapacityAvailableCapacity

    • などの主要なメトリクスを追跡StreamingSessionLatencyし、適切な CloudWatch アラームを設定することで、パフォーマンスのボトルネックが発生します。

すべての運用イベントとメトリクスから学ぶ

運用上のイベントや失敗から学んだ教訓を組織全体で共有することで、継続的な改善の文化を育みます。ビジネス成果への影響を強調します。

  • イベント分析。サービスの中断、パフォーマンスの低下、ユーザーの苦情、容量の問題を文書化して分析します。

  • メトリクスのレビュー。使用状況パターン、パフォーマンス傾向、コストメトリクス、ユーザー満足度データを定期的に分析します。

  • ナレッジ共有。チーム学習セッション、ベストプラクティスドキュメント、チーム間の知識移転、インシデントの遡及のためのプロセスを確立します。

マネージドサービスを使用する

AWS マネージドサービスを使用し、その周囲に標準化された手順を構築することで、運用上のオーバーヘッドを最小限に抑えます。を次の AWS マネージドサービスと統合します。