View a markdown version of this page

Prévention proactive des incidents - AWS DevOps Agent

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prévention proactive des incidents

AWS DevOps L'agent analyse les tendances issues de vos enquêtes sur les incidents afin de fournir des recommandations ciblées qui améliorent continuellement votre posture opérationnelle et préviennent de futurs incidents. Accédez à la prévention proactive des incidents via la page Améliorations de l'application Web Operator.

Comment fonctionne la prévention proactive des incidents

AWS DevOps L'agent évalue les enquêtes récentes sur les incidents afin d'identifier des améliorations durables afin de prévenir de futurs incidents et d'accélérer le délai moyen de détection (MTTD). L'agent analyse plusieurs incidents pour identifier les recommandations susceptibles de prévenir des catégories entières d'incidents à l'avenir, en se concentrant sur les recommandations les plus pertinentes afin de garantir qu'elles sont exploitables.

Par défaut, l'agent exécute automatiquement des évaluations chaque semaine. Vous pouvez suspendre le calendrier si vous préférez exécuter des évaluations uniquement à la demande. Des évaluations manuelles sont toujours disponibles, ce qui est utile lorsqu'une enquête récente justifie une mise en œuvre rapide des améliorations recommandées.

L'agent identifie les améliorations dans quatre catégories, comme indiqué dans le tableau de catégorisation des recommandations sur la page Améliorations :

  • Observabilité : recommandations pour améliorer la surveillance, les alertes, la journalisation et la visibilité du système afin de détecter les problèmes plus rapidement et avec plus de précision.

  • Infrastructure : recommandations pour optimiser la configuration des ressources, le réglage des capacités et la résilience architecturale.

  • Gouvernance — Recommandations pour renforcer les processus de déploiement, les améliorations du pipeline, les pratiques de test et les contrôles opérationnels.

  • Optimisation du code : recommandations pour améliorer la qualité du code des applications, la gestion des erreurs et la résilience du code.

Cette catégorisation vous aide à comprendre les domaines dans lesquels vos améliorations opérationnelles sont les plus nécessaires et vous permet de hiérarchiser les recommandations en fonction des domaines d'intérêt de votre équipe.

Avantages

  • Prévenir les incidents récurrents — Traitez systématiquement les causes profondes plutôt que de répondre de manière répétée aux mêmes types de problèmes

  • Réduisez le travail opérationnel : libérez votre équipe de la lutte répétitive contre les incendies pour se concentrer sur l'innovation et les améliorations stratégiques

  • Améliorez la résilience du système : renforcez votre infrastructure, votre observabilité et vos processus de déploiement sur la base de données réelles sur les incidents

  • Tirez les leçons des modèles historiques — Tirez parti des informations tirées des incidents passés pour apporter des améliorations ciblées ayant le plus grand impact

Résumé de l'agent

Le résumé des agents dans la page Améliorations de l'application Web fournit une description des résultats de la dernière évaluation des incidents récents. Le résumé explique le nombre d'enquêtes sur les incidents analysées, quels incidents sont similaires aux précédents et quelles recommandations ont été créées ou mises à jour avec de nouvelles informations.

Le résumé vous aide à comprendre rapidement ce que l'agent a découvert lors de sa dernière évaluation et met en évidence les recommandations les plus importantes susceptibles d'avoir le plus d'impact sur votre posture opérationnelle.

Contrôle des évaluations

Vous pouvez contrôler le moment où AWS DevOps l'agent évalue les incidents et génère des recommandations :

  • Exécution manuelle des évaluations : cliquez sur le bouton Exécuter maintenant dans la page Améliorations pour démarrer immédiatement une évaluation. Cela est utile lorsqu'une enquête récente justifie une mise en œuvre rapide des améliorations recommandées.

  • Arrêt des évaluations actives : cliquez sur le bouton Arrêter l'évaluation dans la page Améliorations pour arrêter une évaluation en cours.

Gérer les recommandations

AWS DevOps L'agent fournit des recommandations sur la page Améliorations, où vous pouvez les consulter et les gérer :

  • Afficher les détails des recommandations : cliquez sur une recommandation pour ouvrir la page des détails de la recommandation, où vous pouvez voir plus d'informations sur l'amélioration suggérée, notamment les incidents qui ont inspiré la recommandation, les impacts attendus et les prochaines étapes. Pour les recommandations concernant les modifications de code, vous pouvez également consulter la spécification prête à être transmise à un agent de codage pour mise en œuvre.

  • Conserver : cliquez sur « Conserver » pour conserver une recommandation dans votre carnet de commandes à des fins de suivi. Cela vous permet de suivre les améliorations que vous prévoyez de mettre en œuvre et de suivre leur progression.

  • Supprimer — Cliquez sur « Supprimer » pour supprimer une recommandation de votre backlog. Lorsque vous annulez une recommandation, vous pouvez expliquer en langage naturel pourquoi elle ne répond pas à vos besoins. L'agent tire les leçons de ces commentaires et les utilise pour élaborer de futures recommandations, en veillant à ce qu'elles correspondent mieux à vos priorités et exigences opérationnelles au fil du temps.

  • Mise en œuvre — Cliquez sur « Mise en œuvre » pour marquer une recommandation comme terminée. Cela vous permet de suivre les améliorations qui ont été appliquées et permet à l'agent de mesurer l'efficacité de ses recommandations au fil du temps.

  • Suppression automatique — Les recommandations qui n'ont pas été marquées comme conservées ou mises en œuvre peuvent être supprimées après environ 6 semaines si aucun nouvel incident n'aurait été évité en mettant en œuvre la recommandation. Cela garantit que la page Améliorations se concentre sur les améliorations les plus pertinentes pour vos défis opérationnels.

  • Mises à jour des recommandations : les recommandations existantes sont mises à jour lorsque de nouveaux incidents qui auraient pu être évités par la recommandation sont découverts. Les mises à jour peuvent modifier la priorité de la recommandation ou l'affiner en fonction de nouvelles informations.

Priorisation des recommandations

AWS DevOps L'agent classe automatiquement vos recommandations par priorité pour vous aider à vous concentrer d'abord sur les améliorations les plus importantes. Le classement tient compte du contexte spécifique de votre équipe, des modèles opérationnels et de la gravité des problèmes abordés par chaque recommandation.

Comment fonctionne la priorisation

À chaque cycle d'évaluation, l'agent classe vos recommandations actives (celles proposées ou conservées) en combinant les éléments suivants :

  • AI-powered classement : l'agent évalue l'importance relative de vos principales recommandations en fonction de la pertinence de la catégorie, de la gravité de l'incident et de l'impact opérationnel.

  • Notation déterministe : pour les carnets de commandes plus importants, l'agent applique un score de priorité basé sur la fréquence des incidents, leur gravité et leur actualité afin de garantir la cohérence des commandes au-delà des articles les mieux classés.

La liste classée apparaît sur la page Améliorations avec une position de classement numérique (1 étant la priorité la plus élevée). Les recommandations rejetées ou mises en œuvre ne sont pas classées.

Personnalisation des priorités

Vous pouvez influencer la façon dont l'agent classe les recommandations en communiquant les priorités de votre équipe via l'interface de chat :

  • Définition des préférences en matière de catégories : indiquez à l'agent quelles catégories de recommandations sont les plus importantes pour votre équipe (par exemple, « Nous donnons la priorité aux améliorations de l'observabilité plutôt qu'aux modifications de l'infrastructure »). L'agent enregistre ces préférences et les utilise dans les futures évaluations de classement.

  • Fournir du contexte : partagez des informations sur les projets à venir, les exigences de conformité ou les domaines prioritaires de l'équipe. L'agent intègre ce contexte lorsqu'il détermine les recommandations à prioriser.

Pour mettre à jour vos préférences, utilisez l'interface de chat et décrivez les priorités de votre équipe en langage naturel. L'agent confirmera qu'il a bien compris et appliquera vos préférences lors du prochain cycle d'évaluation.

Stabilité du classement

Le rang des recommandations peut changer entre les cycles d'évaluation lorsque :

  • De nouvelles recommandations sont ajoutées qui ont une priorité plus élevée que les recommandations existantes

  • Les préférences déclarées de votre équipe changent

  • Les nouvelles données sur les incidents renforcent ou affaiblissent les arguments en faveur d'une recommandation

Les recommandations que vous avez déjà marquées comme « Keep » conservent leur position dans votre carnet de commandes indépendamment des changements de classement, ce qui garantit que votre flux de travail n'est pas perturbé.

Agent-ready spécifications

Pour les recommandations impliquant des modifications de code ou de configuration, l' AWS DevOps agent peut générer une spécification prête à être utilisée par l'agent. Cette spécification fournit un document structuré qui peut être transmis directement à un agent de codage pour mise en œuvre.

La spécification inclut :

  • Exposé du problème : résumé du problème et de sa cause première

  • Résumé de la solution : description détaillée de l'approche recommandée

  • Référentiels cibles : référentiels spécifiques dans lesquels des modifications doivent être apportées

  • Modifications du code : descriptions détaillées de ce qui doit être modifié et pourquoi, avec des chemins de fichiers spécifiques et des considérations relatives à la mise en œuvre

  • Exigences de test — Quels scénarios doivent être testés

  • Plan de mise en œuvre — Une approche progressive pour mettre en œuvre les changements

Agent-ready les spécifications accélèrent la mise en œuvre en fournissant aux agents de codage le contexte dont ils ont besoin pour apporter des modifications prêtes à être mises en production sans avoir à faire de longs échanges avec les ingénieurs.

Mise en œuvre des recommandations

Pour optimiser la valeur des recommandations proactives en matière de prévention des incidents, considérez les pratiques suivantes pour y donner suite :

  • Utilisation de spécifications prêtes pour l'agent : pour les recommandations relatives aux modifications de code, utilisez la spécification générée pour accélérer la mise en œuvre en la remettant à un agent de codage ou en l'utilisant comme guide détaillé pour la mise en œuvre manuelle.

  • Ajouter des recommandations à votre carnet de tickets : copiez les recommandations dans le système de billetterie ou l'outil de gestion de projet de votre équipe pour vous assurer qu'elles sont priorisées aux côtés des autres travaux d'ingénierie.

  • Hiérarchisation des recommandations en fonction de leur impact — Concentrez-vous d'abord sur les recommandations qui concernent les types d'incidents les plus fréquents ou les plus graves, ou ceux qui affectent les systèmes critiques.

  • Suivi des progrès de la mise en œuvre — Surveillez les recommandations qui ont été mises en œuvre et mesurez leur efficacité en observant si le nombre d'incidents similaires diminue au fil du temps.

  • Coordination avec les équipes de développement : partagez les recommandations avec les équipes appropriées qui possèdent les systèmes concernés, en veillant à ce qu'elles disposent du contexte et des ressources nécessaires pour mettre en œuvre les améliorations.