Vérifiez les événements à Tableau de bord Health Surveillez les vérifications de l'état du système avec CloudWatch

Vérification de l’occurrence d’une récupération automatique des instances

Si votre instance semble avoir été déconnectée puis redémarrée de manière inattendue, il se peut qu’elle ait fait l’objet d’une récupération automatique des instances en réponse à un problème matériel ou logiciel sous-jacent. Vous pouvez le vérifier en vérifiant les événements de récupération automatique des instances dans votre Tableau de bord Health. Vous pouvez également vérifier si un problème matériel ou logiciel sous-jacent a été détecté pour votre instance en consultant la CloudWatch métrique Amazon StatusCheckFailed_System.

Vérifiez les événements à Tableau de bord Health

Lorsqu'une tentative de restauration automatique d'une instance se produit, AWS envoie des événements à votre Tableau de bord Health. L’événement spécifique dépend du mécanisme de restauration configuré et de la réussite ou de l’échec de la tentative.

Pour vérifier la présence d'événements de restauration automatique des instances dans Tableau de bord Health

Ouvrez l' Tableau de bord Health adresse https://phd.aws.amazon.com/phd/home#/.
Recherchez les événements associés à la récupération automatique des instances. La présence de ces événements peut confirmer si une tentative de récupération automatique des instances a eu lieu et son résultat.
- Récupération automatique simplifiée
  - Événements de réussite : AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
  - Événement d’échec : AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
- CloudWatch restauration basée sur l'action
  - Événements de réussite : AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS
  - Événement d’échec : AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

Surveillez les vérifications de l'état du système avec CloudWatch

Vous pouvez vérifier si un problème matériel ou logiciel sous-jacent a été détecté pour votre instance en intégrant la métrique StatusCheckFailed_System. CloudWatch La valeur de métrique indique si une vérification du statut du système a réussi (aucun problème matériel ou logiciel) ou a échoué (problème matériel ou logiciel).

Pour vérifier si un problème matériel ou logiciel sous-jacent a été détecté

Ouvrez la page Metrics de CloudWatch la console à l'adresse https://console.aws.amazon.com/cloudwatch/home? #metricsV2.
Vérifiez que vous êtes dans la même région que votre instance EC2.
Collez la métrique suivante dans le champ de recherche Métriques et appuyez sur Entrée.
```
StatusCheckFailed_System
```
Choisissez EC2 > Per-Instance Metrics.
Dans le tableau, cochez la case en regard de l’instance que vous souhaitez vérifier.
Modifiez la période de requête en fonction de l’heure à laquelle vous pensez que l’événement de restauration s’est produit.
Choisissez l'onglet Graphed metrics, puis pour StatusCheckFailed_System, procédez comme suit :
1. Pour Statistiques, sélectionnez Moyenne, Maximum ou Minimum.
2. Pour Période, choisissez 1 minute.
Vérifiez la valeur de StatusCheckFailed_System.
- Valeur de 0 : la vérification du statut du système a réussi, ce qui indique l’absence de problème matériel ou logiciel sous-jacent.
- Valeur de 1 : la vérification du statut du système a échoué, ce qui indique un problème matériel ou logiciel sous-jacent.

Pour de plus amples informations, veuillez consulter Récupération automatique des instances.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Récupération automatique des instances

Récupération automatique simplifiée