Gestion des incidents

Rubriques

Les incidents sont des problèmes de Service AWS performance qui ont un impact sur votre environnement géré, tel que déterminé par AWS Managed Services (AMS) ou par vous-même. Les incidents identifiés par l'équipe AMS sont d'abord reçus sous la forme d' « événements » : un changement d'état du système capté par le monitoring. Si un seuil configuré est dépassé, l'événement déclenche une alarme, également appelée alerte. L'équipe des opérations AMS détermine si l'événement n'a pas d'impact, s'il s'agit d'un incident (interruption ou dégradation du service) ou d'un problème (cause première sous-jacente d'un ou de plusieurs incidents résolus).

L'équipe AMS reçoit également les incidents que vous avez identifiés par le biais du Support centre ou par programmation à l'aide de l'API AWS Support avec le code de service. sentinel-report-incident

Une fois que l'équipe des opérations d'AMS a reçu votre incident, il est examiné afin de s'assurer qu'il n'est pas préférable de le classer comme une demande de service. Si elle doit être classée comme une demande de service, elle est immédiatement reclassée et l'équipe de demande de service AMS prend le relais et vous en êtes informé. Si l'incident peut être résolu par l'opérateur récepteur, des mesures sont prises pour le résoudre immédiatement. Les opérateurs AMS consultent la documentation interne pour trouver une solution et, si nécessaire, transmettent l'incident à d'autres ressources de support jusqu'à ce qu'il soit résolu. Pour être tenu informé à chaque étape du processus de résolution des incidents, assurez-vous de remplir l'option CC Emails et, si vous souhaitez vous connecter par fédération, connectez-vous avant de suivre le lien contenu dans l'e-mail envoyé par AMS. Une fois le problème résolu, l'équipe des opérations AMS documente l'incident et sa résolution pour une utilisation future.

Si la résolution d'un incident nécessite des modifications de l'infrastructure, un examen de sécurité peut être nécessaire. Les modifications de l'infrastructure susceptibles de nécessiter un examen de sécurité incluent celles liées à l'IAM, à la politique basée sur les ressources ou aux approbations de risques. Ces types d'incidents nécessitent qu'un ingénieur des opérations AMS crée une RFC avant d'apporter la modification, et votre approbation pour cette RFC est requise. Par exemple, si la résolution d'un incident nécessite la mise à jour d'une politique IAM, il y aura un examen de sécurité AMS, puis un ingénieur des opérations AMS créera une RFC avec le type Management | Advanced stack components | Identity and Access Management (IAM) | Update entité ou changement de politique (ct-27tuth19k52b4) et attendra que vous approuviez la RFC avant de continuer.

Note

AMS permet désormais de résoudre les incidents qui nécessitent des modifications de l'infrastructure sans passer par l'étape supplémentaire d'approbation de la RFC. Si les modifications nécessaires pour résoudre l'incident ne nécessitent PAS de révision de sécurité (la modification n'est pas liée à l'IAM, à la politique basée sur les ressources ou aux approbations de risques), AMS peut apporter les modifications en fonction de l'approbation que vous avez reçue lors de l'incident, sans avoir besoin d'une approbation séparée dans un RFC.

Pour les définitions des termes relatifs à la gestion des incidents, consultez les termes clés d'AMS.

Pour comprendre la trajectoire d'escalade des incidents, consultez la section Obtenir de l'aide.

Pour une description de la réponse d'AMS aux incidents, voir Réponse aux incidents d'AMS.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Obtenez de l'aide

Qu'est-ce que la gestion des incidents ?