Pilier de fiabilité - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pilier de fiabilité

Le pilier de fiabilité du AWS Well-Architected Framework porte sur la capacité d'un système à maintenir les fonctionnalités et les niveaux de performance prévus pendant les périodes opérationnelles prévues tout au long de sa durée de vie. Il fournit des directives complètes pour la création et la maintenance de systèmes fiables AWS, y compris des stratégies de test et de validation à toutes les étapes du cycle de vie des charges de travail.

Principaux domaines d'intérêt pour appliquer ce pilier à votre environnement de streaming d' WorkSpaces applications :

  • Gestion et mise à l'échelle de la flotte

  • Fiabilité des sessions

  • Disponibilité des applications

  • Procédures de rétablissement

Restauration automatique en cas de panne

Surveillez KPIs la valeur commerciale afin de déclencher des réponses automatisées capables de prévoir, de prévenir ou de corriger les défaillances avant qu'elles n'aient un impact sur les opérations.

  • Assurez-vous que l'allocation de votre sous-réseau IP tient compte de l'extension et de la disponibilité.

  • Surveillez CloudWatch les indicateurs critiques pour garantir la disponibilité et les performances des services, y compris les indicateurs de capacité du parc tels que AvailableCapacity etInUseCapacity, et les indicateurs de qualité du streaming tels queStreamingSessionLatency.

  • Configurez des alertes pour les seuils de capacité, les indicateurs de santé des sessions, la dégradation des performances et les modifications de l'état de santé du parc.

  • Utilisez les fonctionnalités de mise à l'échelle automatique des WorkSpaces applications intégrées pour :

    • Configurez la capacité minimale et maximale du parc.

    • Définissez des politiques de dimensionnement basées sur l'utilisation des capacités.

    • Définissez des seuils de scale-out et de scale-in en fonction des indicateurs de l'expérience utilisateur et des exigences commerciales plutôt que de simples indicateurs techniques.

  • Créez un environnement de reprise après sinistre pour votre environnement WorkSpaces d'applications. Pour plus d'informations, consultez le billet de AWS blog Considérations relatives à la reprise après sinistre avec Amazon WorkSpaces Applications.

Procédures de reprise des tests

Les environnements cloud permettent de tester automatiquement les scénarios de défaillance et les procédures de restauration. Ces fonctionnalités vous aident à identifier et à corriger les vulnérabilités avant que de véritables défaillances ne se produisent.

  • Tests de reprise de flotte. Mettez en œuvre des tests complets de reprise de flotte dans le cadre de plusieurs scénarios :

    • Simulez la terminaison d'une instance pour vérifier la réponse automatique du dimensionnement.

    • Validez le maintien de la capacité minimale de la flotte.

    • Testez le calendrier de remplacement des instances et la redirection des utilisateurs.

    • Validez l'efficacité des politiques de dimensionnement.

    • Testez les limites de capacité du parc et la gestion des débordements.

  • Test de restauration de session. Mettre en œuvre des procédures de validation de restauration de session :

    • Testez les scénarios de déconnexion et de reconnexion.

    • Vérifiez la préservation de l'état de l'application.

    • Testez différents scénarios d'interruption du réseau.

    • Validez les comportements d'expiration de session.

    • Vérifiez la persistance de l'authentification utilisateur.

    • Vérifiez la gestion du stockage temporaire.

Évoluez horizontalement pour augmenter la disponibilité globale de la charge de travail

Répartissez votre charge de travail sur plusieurs ressources plus petites afin de minimiser l'impact des défaillances individuelles et d'éliminer les points de défaillance uniques.

  • Déployez des instances de flotte dans plusieurs zones de disponibilité.

  • Configurez la capacité minimale de flotte appropriée.

  • Configurez le dimensionnement automatique pour les flottes et définissez des seuils de dimensionnement appropriés.

  • Surveillez l'utilisation des capacités dans l'ensemble du parc.

  • Déployez WorkSpaces des piles d'applications dans plusieurs régions. Pour plus d'informations, consultez le billet de AWS blog Optimize user experience with latency based routing for Amazon Applications. WorkSpaces

Arrêtez de deviner la capacité

Utilisez les fonctionnalités de dimensionnement automatique du cloud pour ajuster dynamiquement les ressources en fonction de la demande. Cela permet d'éviter la saturation des ressources tout en maintenant une efficacité optimale.

  • Surveillez les indicateurs clés tels que CapacityUtilizationAvailableCapacity, et InUseCapacity pour comprendre les besoins en capacité.

  • Suivez les tendances d'utilisation de la flotte sur différentes périodes. Surveillez les tendances quotidiennes, les variations hebdomadaires, les tendances mensuelles et les pics saisonniers.

  • Définissez des politiques de dimensionnement et configurez des seuils de dimensionnement.

  • Assurez-vous qu'il existe un écart suffisant entre les quotas actuels et l'utilisation maximale pour permettre le basculement.

  • Adaptez les quotas et les contraintes de service fixes au sein de votre architecture.

Gérez le changement grâce à l'automatisation

Mettez en œuvre les modifications de l'infrastructure par le biais de l'automatisation, y compris des modifications contrôlées par version du code d'automatisation lui-même.

  • Utilisez iAc pour la configuration de la flotte.

  • Mettez en œuvre des politiques de dimensionnement cohérentes.

  • Utilisez la CLI Image Assistant pour créer des images de manière cohérente.