Configuration de la restauration basée sur l' CloudWatch action sur une EC2 instance - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de la restauration basée sur l' CloudWatch action sur une EC2 instance

Important

Cette section décrit comment configurer de manière proactive les mécanismes de restauration sur une EC2 instance. Ces mécanismes de récupération sont conçus pour rétablir la disponibilité des instances lorsqu’ AWS détecte un problème matériel ou logiciel sous-jacent qui entraîne l’échec d’une vérification du statut du système. Si vous rencontrez actuellement des problèmes pour accéder à votre instance, consultez Résoudre les problèmes liés aux EC2 instances.

S'il est AWS détecté qu'une instance n'est pas disponible en raison d'un problème matériel ou logiciel sous-jacent, la restauration basée sur l'CloudWatch action peut rétablir automatiquement la disponibilité de l'instance en déplaçant l'instance de l'hôte présentant le problème sous-jacent vers un autre hôte.

En cas de restauration basée sur l' CloudWatch action, vous AWS envoie l'un des événements suivants AWS Health Dashboard, en fonction du résultat :

  • Événements de réussite : AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS

  • Événement d’échec : AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

Vous pouvez configurer la restauration basée sur CloudWatch l'action pour ajouter des actions de restauration aux CloudWatch alarmes Amazon. CloudWatch la restauration basée sur l'action fonctionne avec la StatusCheckFailed_System métrique. CloudWatchla restauration basée sur les actions fournit une granularité du temps de réponse et des notifications Amazon Simple Notification Service (Amazon SNS) concernant les actions de to-the-minute restauration et les résultats. Ces options de configuration permettent des tentatives de récupération plus rapides grâce à un contrôle plus précis de la réponse à l'échec de la vérification de l'état du système, par rapport à une récupération automatique simplifiée. Pour plus d'informations sur les CloudWatch options disponibles, consultez la section Contrôles de statut de vos instances.

Toutefois, la restauration basée sur l' CloudWatch action ne peut fonctionner que si une instance est dans running cet état, si aucun événement de service n'est répertorié dans le AWS Health Dashboard et si la capacité est disponible pour le type d'instance. Dans certaines situations, telles que des pannes importantes, des contraintes de capacité peuvent entraîner l’échec des tentatives de récupération. Pour de plus amples informations, veuillez consulter Résoudre les défaillances de restauration basées sur l' CloudWatch action.

Avertissement

Lorsque AWS vous restaurez votre instance en raison d'un problème matériel ou logiciel sous-jacent, soyez conscient des conséquences suivantes : les données stockées dans la mémoire volatile (RAM) et sur les volumes de stockage de l'instance seront perdues, et le temps de fonctionnement du système d'exploitation recommencera à zéro. Pour vous protéger contre la perte de données, nous vous conseillons de créer régulièrement des sauvegardes de vos données essentielles. Pour plus d'informations sur les meilleures pratiques en matière de sauvegarde et de restauration pour les EC2 instances, consultez la section Meilleures pratiques pour Amazon EC2.

Les mécanismes de récupération automatique des instances sont conçus pour les instances individuelles. Pour obtenir des conseils sur la création d’un système résilient, consultez la section Élaboration d’un système résilient.

Exigences relatives à l'activation de la restauration basée sur l' CloudWatch action

CloudWatch la restauration basée sur l'action peut être activée sur les instances qui répondent aux critères suivants :

Types d’instances
  • Usage général : A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-Flex, M8a, M8g, M8GB, M8i, M8i-Flex, T1, T2, T3, T3a, T4g

  • Optimisé pour le calcul : C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gN, C7i, C7i-Flex, C8a, C8g, C8gb, C8i, C8i-Flex

  • À mémoire optimisée : R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8a, R8g, R8gb, R8gn, R8i, R8i-flex, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2idn, X2iedn, X2iezn, X8g

  • Calcul accéléré : G3, G5g, Inf1, P3, VT1

  • Calcul haute performance : Hpc6a | Hpc7a | Hpc7g

  • Instances metal : n’importe lequel des types ci-dessus avec la taille de l’instance metal.

  • Si des volumes de stockage d’instance sont ajoutés au lancement : alors seuls les types d’instance suivants sont pris en charge : M3, C3, R3, X1, X1e, X2idn, X2iedn

Tenancy
  • Partagé

  • Dedicated Instance

Pour de plus amples informations, veuillez consulter Instances dédiées Amazon EC2.

Limites

CloudWatch la restauration basée sur l'action n'est pas prise en charge pour les instances présentant les caractéristiques suivantes :

  • Location : hôte dédié. Pour les hôtes dédiés, utilisez plutôt la récupération automatique de l’hôte dédié.

  • Mise en réseau : instances utilisant un adaptateur Elastic Fabric Adapter

  • Auto Scaling : instances qui font partie d’un groupe Auto Scaling

  • Maintenance : instances qui font actuellement l’objet d’une opération de maintenance programmée

Recherche des types d’instances pris en charge

Vous pouvez consulter les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action.

Console
Pour afficher les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation de gauche, choisissez Instance Types (Types d’instance).

  3. Dans la barre de filtre, saisissez Auto Recovery support = true. Le tableau des types d'instances affiche tous les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action.

  4. (Facultatif) Ajoutez des filtres pour affiner davantage la recherche à des types d’instances spécifiques qui vous intéressent.

AWS CLI
Pour afficher les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action

Utilisez la commande describe-instance-types avec le filtre auto-recovery-supported.

aws ec2 describe-instance-types \ --filters Name=auto-recovery-supported,Values=true \ --query "InstanceTypes[*].[InstanceType]" \ --output text | sort
PowerShell
Pour afficher les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action

Utilisez l'Get-EC2InstanceTypeapplet de commande avec le auto-recovery-supported filtre.

Get-EC2InstanceType ` -Filter @{Name="auto-recovery-supported";Values="true"} | ` Select InstanceType | Sort-Object InstanceType

Configuration de la restauration basée sur l' CloudWatch action

Pour configurer la restauration basée sur l' CloudWatch action pour une EC2 instance, créez une CloudWatch alarme qui surveille la StatusCheckFailed_System métrique pour l'instance spécifiée. Réglez l’alarme pour qu’elle se déclenche lorsque la valeur de la métrique est égale à 1, ce qui indique un échec de la vérification du statut du système. Configurez l’action d’alarme pour récupérer automatiquement l’instance lorsqu’elle est déclenchée.

Vous pouvez configurer l'alarme à l'aide de la EC2 console Amazon ou de la CloudWatch console. Pour les instructions, consultez ce guide Ajouter des actions de restauration aux CloudWatch alarmes Amazon de l'utilisateur ou Ajouter des actions de restauration aux CloudWatch alarmes Amazon dans le guide de CloudWatch l'utilisateur Amazon.

Résoudre les défaillances de restauration basées sur l' CloudWatch action

Si la restauration basée sur l' CloudWatch action ne parvient pas à récupérer votre instance, prenez en compte les problèmes suivants :

  • AWS les événements de service sont en cours

    CloudWatch la restauration basée sur l'action ne fonctionne pas lors d'événements de service dans le AWS Health Dashboard. Il se peut que vous ne receviez pas de notifications d’échec de récupération pour de tels événements. Pour obtenir les dernières informations sur la disponibilité des services, consultez la page état de santé des services.

  • Capacité insuffisante

    Le matériel de remplacement est temporairement insuffisant pour effectuer la migration de l’instance.

  • Le nombre maximal de tentatives de restauration quotidiennes est atteint

    L’instance a atteint l’autorisation quotidienne maximale de tentatives de récupération. Votre instance peut être mise hors service ultérieurement si la récupération automatique échoue et s’il est établi qu’une dégradation matérielle est à l’origine de l’échec de la vérification initiale du statut du système.

Si l'échec de la vérification de l'état du système de l'instance persiste malgré plusieurs tentatives de récupération, consultez Résoudre les problèmes des instances dont les vérifications d'état ont échoué pour obtenir des instructions supplémentaires.