Qu'est-ce qu'AWS Incident Detection and Response ? - Guide de l'utilisateur d'AWS pour la détection et la réponse aux incidents

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce qu'AWS Incident Detection and Response ?

AWS Incident Detection and Response offre aux clients éligibles du support aux AWS entreprises éligibles un engagement proactif en cas d'incident afin de réduire les risques de défaillance et d'accélérer le rétablissement des charges de travail critiques après une interruption. La détection et la réponse aux incidents facilitent votre collaboration AWS pour développer des runbooks et des plans de réponse personnalisés en fonction de chaque charge de travail intégrée.

La détection et la réponse aux incidents offrent les fonctionnalités clés suivantes :

  • Observabilité améliorée : des AWS experts fournissent des conseils pour vous aider à définir et à corréler les métriques et les alarmes entre les couches d'application et d'infrastructure de votre charge de travail afin de détecter les perturbations à un stade précoce.

  • Temps de réponse de 5 minutes : les ingénieurs de gestion des incidents (IMEs) surveillent vos charges de travail intégrées 24 heures sur 24, 7 jours sur 7 pour détecter les incidents critiques. Ils IMEs répondent dans les 5 minutes suivant le déclenchement d'une alarme ou en réponse à un dossier de Support critique que vous soumettez à la section Détection et réponse aux incidents.

  • Résolution plus rapide : IMEs utilisez des runbooks prédéfinis et personnalisés développés pour vos charges de travail afin de répondre en 5 minutes, de créer un dossier de support en votre nom et de gérer les incidents liés à votre charge de travail. IMEs assurez la responsabilité des incidents à un seul fil et maintenez le contact avec les bons AWS experts jusqu'à ce que l'incident soit résolu.

  • Réduction du risque de défaillance : après résolution, IMEs nous vous fournirons un examen post-incident (sur demande). De plus, des AWS experts travaillent avec vous pour appliquer les leçons apprises afin d'améliorer le plan de réponse aux incidents et les manuels d'exécution. Vous pouvez également tirer parti AWS Resilience Hub du suivi continu de la résilience de vos charges de travail.