Vérification de l’occurrence d’une récupération automatique des instances - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vérification de l’occurrence d’une récupération automatique des instances

Si votre instance semble avoir été déconnectée puis redémarrée de manière inattendue, il se peut qu’elle ait fait l’objet d’une récupération automatique des instances en réponse à un problème matériel ou logiciel sous-jacent. Vous pouvez le vérifier en vérifiant les événements de récupération automatique des instances dans votre AWS Health Dashboard. Vous pouvez également vérifier si un problème matériel ou logiciel sous-jacent a été détecté pour votre instance en consultant la CloudWatch métrique Amazon StatusCheckFailed_System.

Vérifiez les événements à AWS Health Dashboard

Lorsqu'une tentative de restauration automatique d'une instance se produit, AWS envoie des événements à votre AWS Health Dashboard. L’événement spécifique dépend du mécanisme de restauration configuré et de la réussite ou de l’échec de la tentative.

Pour vérifier les événements de restauration automatique des instances dans AWS Health Dashboard
  1. Ouvrez le AWS Health Dashboard at https://phd.aws.amazon.com/phd/home#/.

  2. Recherchez les événements associés à la récupération automatique des instances. La présence de ces événements peut confirmer si une tentative de récupération automatique des instances a eu lieu et son résultat.

    • Récupération automatique simplifiée

      • Événements de réussite : AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

      • Événement d’échec : AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE

    • CloudWatch restauration basée sur l'action

      • Événements de réussite : AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS

      • Événement d’échec : AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

Surveillez les vérifications de l'état du système avec CloudWatch

Vous pouvez vérifier si un problème matériel ou logiciel sous-jacent a été détecté pour votre instance en intégrant la métrique StatusCheckFailed_System. CloudWatch La valeur de métrique indique si une vérification du statut du système a réussi (aucun problème matériel ou logiciel) ou a échoué (problème matériel ou logiciel).

Pour vérifier si un problème matériel ou logiciel sous-jacent a été détecté
  1. Ouvrez la page Metrics de CloudWatch la console à la page https://console.aws.amazon.com/cloudwatch/d'accueil ? #metricsV2.

  2. Vérifiez que vous vous trouvez dans la même région que votre EC2 instance.

  3. Collez la métrique suivante dans le champ de recherche Métriques et appuyez sur Entrée.

    StatusCheckFailed_System
  4. Choisissez EC2 > Métriques par instance.

  5. Dans le tableau, cochez la case en regard de l’instance que vous souhaitez vérifier.

  6. Modifiez la période de requête en fonction de l’heure à laquelle vous pensez que l’événement de restauration s’est produit.

  7. Choisissez l'onglet Graphed metrics, puis pour StatusCheckFailed_System, procédez comme suit :

    1. Pour Statistiques, sélectionnez Moyenne, Maximum ou Minimum.

    2. Pour Période, choisissez 1 minute.

  8. Vérifiez la valeur de StatusCheckFailed_System.

    • Valeur de 0 : la vérification du statut du système a réussi, ce qui indique l’absence de problème matériel ou logiciel sous-jacent.

    • Valeur de 1 : la vérification du statut du système a échoué, ce qui indique un problème matériel ou logiciel sous-jacent.

Pour de plus amples informations, veuillez consulter Récupération automatique des instances.