Qu'est-ce que la gestion des incidents ? - Guide de l'utilisateur avancé d'AMS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce que la gestion des incidents ?

La gestion des incidents est le processus utilisé par AMS pour enregistrer, agir, communiquer la progression et notifier les incidents actifs.

L'objectif du processus de gestion des incidents est de garantir que le fonctionnement normal de votre service géré est rétabli le plus rapidement possible, que l'impact commercial est minimisé et que toutes les parties concernées sont tenues informées.

Les exemples d'incidents incluent (sans toutefois s'y limiter) la perte ou la dégradation de la connectivité réseau, un processus ou une API qui ne répondent pas, ou une tâche planifiée qui n'est pas exécutée (par exemple, une sauvegarde échouée).

Le graphique suivant illustre le flux de travail d'un incident que vous avez signalé à AMS.

Flux de travail de gestion des incidents entre les opérations AMS et le client en cas d'incident signalé par le client.

Ce graphique illustre le flux de travail d'un incident qui vous a été signalé par AMS.

Flux de travail de gestion des incidents entre les opérations AMS et le client ayant CloudWatch détecté un incident.

Priorité de l'incident

Les incidents créés dans le centre de support AWS, la console ou l'API de support (SAPI) ont des classifications différentes de celles des incidents créés dans la console AMS.

  • Faible : les fonctions non critiques de votre service ou de votre application métier liées aux ressources AWS ou AMS sont affectées.

  • Moyen : un service ou une application métier lié aux ressources AWS and/or AMS est modérément impacté et fonctionne de manière dégradée.

  • Élevé : votre activité est fortement impactée. Les fonctions critiques de votre application liées aux ressources AWS and/or AMS ne sont pas disponibles. Réservé aux pannes les plus critiques affectant les systèmes de production.

Note

La console de support AWS propose cinq niveaux de priorité des incidents que nous traduisons en trois niveaux AMS.

Problème ou incident

Lorsqu'AMS estime qu'un incident révèle un défaut plus important ou une mauvaise configuration et qu'il est susceptible de se reproduire, il est considéré comme un problème plutôt que comme un simple incident. Dans de tels cas, AMS analyse le problème et propose des suggestions pour le résoudre.