Pilier d’excellence opérationnelle - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pilier d’excellence opérationnelle

L'excellence opérationnelle (OE) représente un engagement à concevoir des solutions logicielles de haute qualité qui répondent et dépassent constamment les attentes des utilisateurs. Le pilier de l'excellence opérationnelle du AWS Well-Architected Framework englobe des stratégies éprouvées pour une organisation efficace des équipes, une conception robuste des charges de travail, des opérations efficaces à grande échelle et une adaptation fluide à l'évolution des exigences au fil du temps. En adhérant à ces principes, les entreprises peuvent s'assurer que leurs systèmes restent résilients, performants et adaptés à l'évolution des besoins de l'entreprise.

Principaux domaines d'intérêt pour appliquer ce pilier à votre environnement de streaming d' WorkSpaces applications :

  • Surveillance et observabilité

  • Automatisation et DevOps

  • Procédures opérationnelles et documentation

  • Support et gestion des incidents

Organisez les équipes en fonction des résultats commerciaux

Créez un modèle opérationnel aligné sur le cloud avec un engagement fort de la direction, dans lequel les objectifs commerciaux et les indicateurs de performance clés (KPIs) stimulent la transformation organisationnelle grâce à l'optimisation des personnes, des processus et des technologies.

  • Structure de l'équipe. Constituez des équipes dédiées qui s'alignent sur les résultats du streaming des applications. Par exemple :

    • L'équipe de gestion des images est responsable du packaging des applications et de l'optimisation des images.

    • L'équipe des opérations de flotte gère la capacité, les performances et la mise à l'échelle.

    • L'équipe chargée de l'expérience utilisateur s'occupe du support et de la satisfaction des utilisateurs finaux.

  • KPIs et métriques. Définissez et suivez des indicateurs adaptés à l'entreprise, tels que :

    • Taux de disponibilité des applications

    • Il est temps de déployer de nouvelles applications

    • Coût par heure de diffusion d'une application

  • Modèle de fonctionnement. Créez des processus clairs pour :

    • Intégration et mises à jour des applications

    • Gestion de la capacité du parc

    • Provisionnement de l'accès utilisateur

    • Réponse et résolution des incidents

Mettez en œuvre l'observabilité pour obtenir des informations exploitables

Mettez en œuvre une surveillance et une observabilité complètes pour suivre l'état de KPIs la charge de travail. Ce principe permet de prendre des décisions basées sur les données et d'améliorer de manière proactive les performances, la fiabilité et les coûts.

Automatisez en toute sécurité si possible

Appliquez les principes de l'infrastructure sous forme de code (IaC) pour automatiser tous les aspects de vos opérations de charge de travail. Utilisez des glissières de sécurité pour garantir une exécution sûre et cohérente tout en réduisant les interventions manuelles.

  • Automatisez la création et la configuration des images d' WorkSpaces applications à l'aide de l'interface de ligne de commande Image Assistant. Pour plus d'informations, consultez Créer votre image Amazon WorkSpaces Applications par programmation à l'aide des opérations de la CLI Image Assistant dans la documentation des WorkSpaces applications.

    • Installation des applications : utilisez la CLI Image Assistant pour automatiser l'installation des applications lors de la création d'images.

    • Création d'images : créez des images d' WorkSpaces applications par programmation à l'aide des commandes de la CLI Image Assistant.

    • Gestion de la configuration : automatisez la configuration des paramètres par défaut de l'application et des paramètres de lancement.

  • Automatisez la personnalisation des images des WorkSpaces applications. Pour plus d'informations, consultez le billet de AWS blog Créer automatiquement des images Windows WorkSpaces d'applications personnalisées.

  • Appliquez IaC pour déployer l'infrastructure et les composants d'application pour les WorkSpaces applications. Pour plus d'informations, consultez le billet de AWS blog Automatisation de l'infrastructure et du déploiement d'applications pour Amazon WorkSpaces Applications avec Terraform.

  • Mettez en œuvre des processus automatisés pour la gestion de flotte, notamment :

    • Évolution de la flotte en fonction de la demande. Configurez des politiques de dimensionnement automatique pour ajuster automatiquement la capacité du parc en fonction des indicateurs d'utilisation. Pour plus d'informations, consultez le billet de AWS blog Utiliser AWS Lambda pour ajuster les étapes de dimensionnement et les seuils pour Amazon WorkSpaces Applications.

    • Mises à jour des images de base. Bénéficiez des mises à jour automatiques de l'image de base des WorkSpaces applications fournie par AWS.

    • Optimisation des capacités. Définissez des seuils de dimensionnement automatisés pour optimiser l'utilisation des ressources en fonction des modèles de demande.

  • Configurez les garde-corps pour automatiser les contrôles de sécurité :

    • Limites de taille maximale du parc. Fixez des limites supérieures à la capacité du parc afin d'éviter le surprovisionnement.

    • Configuration de la politique de dimensionnement. Mettez en œuvre des politiques de dimensionnement par étapes ou de suivi des cibles avec des seuils appropriés.

    • Quotas de service. Utilisez les quotas de AWS service comme limites intégrées pour éviter une allocation de ressources excessive.

    • Protection évolutive. Configurez la protection évolutive pour empêcher la suppression d'instances actives lors d'événements de dimensionnement.

  • Effectuez des tests et des validations, notamment des tests de création d'images, de flotte et d'intégration.

    • Test du générateur d'images :

      • Testez les applications directement dans l'interface du générateur d'images.

      • Vérifiez le lancement et le fonctionnement de l'application.

      • Testez les paramètres et les configurations utilisateur.

      • Validez la compatibilité des applications.

    • Tests de flotte :

      • Testez les sessions de streaming à partir de différents appareils clients.

      • Vérifiez les droits et les accès des utilisateurs.

      • Validez les performances des applications.

      • Testez l'expérience utilisateur pour les éléments et les opérations tels que le presse-papiers, le transfert de fichiers et l'impression.

    • Tests d'intégration :

      • Testez l'authentification basée sur Active Directory ou SAML 2.0.

      • Testez les dossiers personnels et le stockage persistant.

      • Testez les droits des applications.

      • Testez la redirection du périphérique USB (si elle est configurée).

  • Utilisez le gestionnaire WorkSpaces d'applications pour automatiser le packaging et le déploiement des applications. Pour plus d'informations, consultez le billet de AWS blog Simplifiez l'intégration des applications avec le gestionnaire d'applications pour Amazon WorkSpaces Applications.

  • Automatisez le déploiement de nouvelles versions d'applications en utilisant des pipelines d'intégration continue et de livraison continue (CI/CD). Pour plus d'informations, consultez le billet de AWS blog Screening Eagle : Optimize CI/CD and end user experience in Amazon WorkSpaces Applications.

Effectuez des modifications fréquentes, mineures et réversibles

Créez des charges de travail évolutives et faiblement couplées qui permettent des déploiements automatisés fréquents et à petite échelle avec un minimum de risques et des fonctionnalités de restauration faciles.

  • Pour les mises à jour d'images, utilisez la création d'images versionnées et les mises à jour incrémentielles.

    • Création d'images versionnées :

      • Créez de nouvelles images pour chaque ensemble de modifications à l'aide d'un générateur d'images.

      • Gérez plusieurs versions d'image pour prendre en charge les scénarios de restauration.

      • Utilisez des stratégies AWS de balisage pour suivre les versions et les attributs des images.

    • Mises à jour incrémentielles :

      • Apportez de petites modifications incrémentielles aux applications ou aux configurations.

      • Testez soigneusement les mises à jour dans le générateur d'images avant de créer une nouvelle image.

      • Documentez toutes les modifications que vous avez apportées dans chaque nouvelle version d'image.

  • Pour les mises à jour du parc de contrôle :

    • Créez de nouvelles flottes avec des images mises à jour à des fins de test.

    • Modifiez les attributs de flotte existants sans perturber les sessions actives.

  • Établissez des procédures de gestion des modifications pour la documentation, les protocoles de test, les flux de travail d'approbation et les processus de surveillance.

    • Documentation :

      • Conservez des journaux de modifications détaillés pour toutes les mises à jour d'images et de flotte.

      • Documentez les procédures de test et les résultats pour chaque modification.

      • AWS CloudTrailÀ utiliser pour suivre et auditer les modifications de configuration.

    • Protocoles de test :

      • Établissez un processus de test complet pour tous les changements.

      • Incluez des tests de fonctionnalité, de performance et d'expérience utilisateur des applications.

      • Effectuez des tests dans le générateur d'images avant de créer de nouvelles images.

      • Effectuez des tests supplémentaires sur des flottes non destinées à la production avant le déploiement complet.

    • Flux de travail d'approbation :

      • Mettez en œuvre un processus d'approbation pour les modifications apportées aux environnements de production.

      • Définissez des critères pour les modifications nécessitant une approbation par rapport aux mises à jour standard.

      • Définissez les rôles et les responsabilités pour l'approbation des modifications.

    • Surveillance et validation :

      • Utilisez Amazon CloudWatch pour surveiller les performances du parc et des applications après les modifications.

      • Configurez des alertes pour les indicateurs clés afin d'identifier rapidement les problèmes après les mises à jour.

      • Réalisez des examens après la mise en œuvre pour valider le succès du changement et en tirer des enseignements.

Affiner fréquemment les procédures opérationnelles

Améliorez continuellement les procédures opérationnelles grâce à des révisions régulières, à des mises à jour et à l'engagement de l'équipe afin de tenir toutes les parties prenantes informées et conformes aux meilleures pratiques.

  • Gestion de la documentation Conservez la documentation actualisée et contrôlée par version des procédures relatives aux WorkSpaces applications dans un emplacement central afin de garantir la cohérence opérationnelle et le partage des connaissances entre les équipes.

    • Documentation requise : Conservez up-to-date la documentation relative aux opérations critiques des WorkSpaces applications pour la création et la gestion d'images, les opérations de flotte et le dépannage.

    • Examens opérationnels : surveillez et passez en revue les principaux aspects opérationnels, notamment les indicateurs de performance et la gestion des incidents.

  • Amélioration continue. Améliorez systématiquement le fonctionnement des WorkSpaces applications en incorporant Service AWS des mises à jour, des mesures opérationnelles et les meilleures pratiques apprises dans les procédures standard.

    • Mises à jour du service : surveillez WorkSpaces les notes de mise à jour des applications pour connaître les nouvelles fonctionnalités, les améliorations de service, les mises à jour de sécurité et la disponibilité régionale.

    • Meilleures pratiques : passez en revue et intégrez les mises à jour de AWS Well-Architected Framework, les meilleures pratiques en matière d'applications WorkSpaces , les architectures de référence AWS et les recommandations de sécurité. AWS

    • Gestion des connaissances : Maintenir et mettre à jour les procédures opérationnelles standard, les manuels d'exécution, les guides de dépannage et la documentation d'assistance aux utilisateurs.

Anticipez les défaillances

Procédez régulièrement à des tests de scénarios de défaillance pour comprendre les risques, valider les procédures de réponse et améliorer la préparation de l'équipe à la gestion des incidents réels.

  • Tests de défaillance. Simulez et testez régulièrement les défaillances telles que l'épuisement de la capacité du parc, les échecs de lancement d'applications et les problèmes de connectivité réseau.

    • Épuisement de la capacité du parc :

      • Surveillez et testez le comportement de mise à l'échelle de la flotte à l'approche des limites de capacité.

      • Configurez les CloudWatch alarmes CapacityUtilization et AvailableCapacity les métriques.

      • Mettre en œuvre des procédures pour gérer les contraintes de capacité pendant les pics d'utilisation.

    • Échec du lancement de l'application :

      • Testez le comportement de lancement de l'application sur les instances de streaming.

      • Validez l'accès aux applications et les performances des différentes configurations de flotte.

    • Problèmes de connectivité réseau :

      • Testez les performances des sessions de streaming dans différentes conditions de réseau.

      • Surveillez StreamingSessionLatency les problèmes de qualité de connexion.

      • Assurez-vous que les paramètres VPC et les groupes de sécurité sont correctement configurés.

  • Procédures de rétablissement. Élaborer et tester des procédures pour :

    • Basculement de flotte entre AWS Zones de disponibilité. En outre, documentez les procédures pour augmenter la capacité de la flotte, gérer les mises à jour de la flotte et répondre aux problèmes de santé des instances.

    • Gestion des données utilisateur :

      • Configurez et testez les solutions de persistance et de stockage des paramètres d'application pour les dossiers personnels dans Amazon Simple Storage Service (Amazon S3) pour les flottes Windows et les systèmes de fichiers partagés dans Amazon Elastic File System (Amazon EFS) pour les flottes Linux.

      • Validez la synchronisation des données entre les sessions.

    • Continuité du service. Maintenez les procédures de création de nouvelles instances de flotte, de gestion des mises à jour des images et de gestion des déconnexions de sessions.

  • Gestion des risques Identifiez et atténuez :

    • Contraintes de capacité en définissant une capacité minimale de flotte appropriée, en configurant des politiques de dimensionnement automatique en fonction des modèles de demande et en surveillant les tendances d'utilisation de la flotte à l'aide de CloudWatch métriques telles que CapacityUtilizationInUseCapacity, etAvailableCapacity.

    • Des problèmes de performance liés au suivi des indicateurs clés tels que la configuration des alarmes appropriées StreamingSessionLatency et à la configuration des alarmes appropriées. CloudWatch

Tirez les leçons de tous les événements opérationnels et de tous les indicateurs

Favorisez une culture d'amélioration continue en partageant les leçons tirées des événements opérationnels et des défaillances au sein de l'organisation. Soulignez leur impact sur les résultats commerciaux.

  • Analyse des événements. Documentez et analysez les interruptions de service, la dégradation des performances, les plaintes des utilisateurs et les problèmes de capacité.

  • Examen des métriques. Analysez régulièrement les modèles d'utilisation, les tendances de performance, les indicateurs de coûts et les données de satisfaction des utilisateurs.

  • Partage des connaissances. Établissez des processus pour les sessions d'apprentissage en équipe, la documentation des meilleures pratiques, le transfert de connaissances entre les équipes et les rétrospectives des incidents.

Utiliser des services gérés

Minimisez les frais d'exploitation en utilisant des services AWS gérés et en élaborant des procédures normalisées autour de ceux-ci. Intégrez les services AWS gérés suivants :