Créez des alarmes CloudWatch pour les instances Amazon EC2 qui échouent aux contrôles de statut - Amazon Elastic Compute Cloud

Créez des alarmes CloudWatch pour les instances Amazon EC2 qui échouent aux contrôles de statut

Vous pouvez utiliser les métriques de vérification de statut pour créer des alarmes CloudWatch afin de vous alerter lorsqu’une instance connaît un échec de contrôle de statut.

Les contrôles de statut et les alarmes de contrôle peuvent temporairement passer à un statut de données insuffisant s'il manque des points de données métriques. Bien que cela soit rare, cela peut se produire lorsqu'il y a une interruption dans les systèmes de rapports métriques, même lorsqu'une instance est saine. Nous vous recommandons de traiter cet état comme une donnée manquante plutôt que comme un échec de contrôle de statut ou comme le déclenchement d’une alarme. Ceci est particulièrement important lorsque vous effectuez des actions d’arrêt, de résiliation, de redémarrage ou de restauration sur l’instance en réponse.

Console

Cet exemple configure une alarme qui envoie une notification lorsqu’une instance échoue à un contrôle de statut. Vous pouvez éventuellement arrêter, résilier ou récupérer l’instance.

Pour créer une alarme de contrôle de statut
  1. Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez instances.

  3. Sélectionnez l’instance, choisissez l’onglet Status Checks (Contrôles des statuts), puis choisissez Actions, Create status check alarm (Créer une alarme de contrôle de statut).

  4. Sur la page Manage CloudWatch alarms (Gérer les alarmes CloudWatch), sous Add or edit alarm (Ajouter ou modifier une alarme), sélectionnez Create an alarm (Créer une alarme).

  5. Pour Alarm notification (Notification d’alarme), activez ou désactivez les notifications Amazon Simple Notification Service (Amazon SNS). Sélectionnez une rubrique Amazon SNS existante ou entrez un nom pour créer une nouvelle rubrique.

    Si vous ajoutez une adresse e-mail à la liste des destinataires ou créez une nouvelle rubrique, Amazon SNS envoie un e-mail de confirmation à chaque nouvelle adresse. Chaque destinataire doit choisir le lien de confirmation dans l’e-mail. Seules les adresses confirmées reçoivent des notifications d’alerte.

  6. Activez Alarm action (Action d’alarme) pour spécifier une action à effectuer lorsque l’alarme est déclenchée. Sélectionnez l’action.

  7. Pour Alarm thresholds (Seuils d’alarme), sélectionnez la métrique et les critères de l’alarme.

    Vous pouvez laisser les paramètres par défaut pour Regrouper les échantillons par (Moyenne) et Type de données à échantillonner (Échec de la vérification de statut : soit), ou vous pouvez les modifier en fonction de vos besoins.

    Dans Consecutive period (Période consécutive), définissez le nombre de périodes que vous souhaitez évaluer et, dans Period (Période), sélectionnez la période d’évaluation avant de déclencher l’alarme et d’envoyer un e-mail.

  8. (Facultatif) Pour Exemple de données de métrique, choisissez Ajouter au tableau de bord.

  9. Sélectionnez Créer.

Si vous devez apporter des modifications à une alarme de statut d’instance, vous pouvez modifier celle-ci.

Pour modifier une alarme de contrôle de statut
  1. Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez instances.

  3. Sélectionnez l’instance et choisissez Actions, Surveillance, Gérer les alarmes CloudWatch.

  4. Sur la page Manage CloudWatch alarms (Gérer les alarmes CloudWatch), sous Add or edit alarm (Ajouter ou modifier une alarme), sélectionnez Edit an alarm (Modifier une alarme).

  5. Dans Search for alarm (Rechercher une alarme), sélectionnez l’alarme.

  6. Une fois les modifications terminées, sélectionnez Update (Mettre à jour).

AWS CLI

Dans l’exemple suivant, l’alarme publie une notification dans une rubrique SNS lorsque l’instance échoue lors d’un contrôle de statut d’instance ou un contrôle de statut de système pour au moins deux périodes consécutives. La métrique CloudWatch utilisée est StatusCheckFailed.

Pour créer une alarme de contrôle de statut
  1. Sélectionnez une rubrique SNS existante ou créez-en une nouvelle. Pour plus d’informations, consultez la section Accès à Amazon SNS dans l’AWS CLI dans le Guide de l’utilisateur AWS Command Line Interface.

  2. Utilisez la commande list-metrics suivante afin d’afficher les métriques Amazon CloudWatch disponibles pour Amazon EC2.

    aws cloudwatch list-metrics --namespace AWS/EC2
  3. Utilisez la commande put-metric-alarm suivante pour créer l’alarme.

    aws cloudwatch put-metric-alarm \ --alarm-name StatusCheckFailed-Alarm-for-i-1234567890abcdef0 \ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0 \ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actions arn:aws:sns:us-west-2:111122223333:my-sns-topic

    La période est le temps (en secondes) pendant lequel les métriques Amazon CloudWatch sont recueillies. Dans cet exemple, 300, qui correspond à 60 secondes multipliées par 5 minutes, est utilisé. La période d’évaluation est le nombre de périodes consécutives pour lesquelles la valeur de la métrique doit être comparée au seuil. Dans cet exemple, 2 est utilisé. Les actions d’alarme correspondent aux actions à exécuter lors du déclenchement de cette alarme.

PowerShell
Pour créer une alarme de contrôle de statut

Utilisez l’applet de commande Write-CWMetricAlarm comme suit pour publier des notifications dans une rubrique SNS lorsque l’instance échoue lors d’un contrôle de statut pour au moins deux périodes consécutives.

Write-CWMetricAlarm ` -AlarmName "StatusCheckFailed-Alarm-for-i-1234567890abcdef0" ` -MetricName "StatusCheckFailed" ` -Namespace "AWS/EC2" ` -Statistic "Maximum" ` -Dimension @{Name="InstanceId"; Values="i-1234567890abcdef0"} ` -Unit "Count" ` -Period 300 ` -EvaluationPeriod 2 ` -Threshold 1 ` -ComparisonOperator "GreaterThanOrEqualToThreshold" ` -AlarmAction "arn:aws:sns:us-west-2:111122223333:my-sns-topic"

La période est le temps (en secondes) pendant lequel les métriques Amazon CloudWatch sont recueillies. Dans cet exemple, 300, qui correspond à 60 secondes multipliées par 5 minutes, est utilisé. La période d’évaluation est le nombre de périodes consécutives pour lesquelles la valeur de la métrique doit être comparée au seuil. Dans cet exemple, 2 est utilisé. Les actions d’alarme correspondent aux actions à exécuter lors du déclenchement de cette alarme.