Aidez à améliorer cette page
Pour contribuer à ce guide de l’utilisateur, cliquez sur le lien Modifier cette page sur GitHub qui se trouve dans le volet droit de chaque page.
Surveillez votre cluster à l’aide du tableau de bord d’observabilité
La console Amazon EKS comprend un tableau de bord d’observabilité qui offre une visibilité sur les performances de votre cluster. Les informations qu’il fournit vous aident à détecter, dépanner et résoudre rapidement les problèmes. Vous pouvez ouvrir la section applicable du tableau de bord d’observabilité en sélectionnant un élément dans le Résumé de l’état et des performances. Ce résumé est inclus à plusieurs endroits, notamment dans l’onglet Observabilité.
Le tableau de bord d’observabilité est divisé en plusieurs onglets.
Récapitulatif
Le Résumé de l’intégrité et des performances répertorie la quantité d’articles dans différentes catégories. Chaque numéro agit comme un lien hypertexte vers un emplacement du tableau de bord d’observabilité contenant une liste pour cette catégorie.
Santé du cluster
Santé du cluster fournit des notifications importantes à prendre en compte, dont certaines peuvent nécessiter une action immédiate de votre part. Cette liste vous permet de consulter les descriptions et les ressources concernées. La santé du cluster comprend deux tableaux : Problèmes de santé et Informations sur la configuration. Pour actualiser le statut des Problèmes de santé, cliquez sur le bouton d’actualisation ( ↻ ). Les Informations sur la configuration sont mises à jour automatiquement toutes les 24 h et ne peuvent pas être actualisées manuellement.
Pour plus d’informations sur les Problèmes de santé, consultez Foire aux questions sur l’intégrité du cluster et codes d’erreur avec chemins de résolution. Pour plus d’informations sur les Informations sur la configuration, consultez Préparation aux mises à niveau des versions Kubernetes et résolution des erreurs de configuration grâce aux informations sur les clusters.
Surveillance du plan de contrôle
L’onglet Surveillance du plan de contrôle est divisé en trois sections, chacune vous aidant à surveiller et à dépanner le plan de contrôle de votre cluster.
Métriques
Pour les clusters Kubernetes version 1.28 et supérieure, la section Métriques affiche des graphiques de plusieurs métriques recueillies pour divers composants du plan de contrôle.
Vous pouvez définir la période utilisée par l’axe X de chaque graphique en effectuant des sélections en haut de la section. Vous pouvez actualiser les données à l’aide du bouton d’actualisation ( ↻ ). Pour chaque graphique distinct, le bouton ellipses verticales ( ⋮ ) ouvre un menu contenant les options de CloudWatch.
Ces métriques et bien d’autres sont automatiquement disponibles en tant que métriques de surveillance basique dans CloudWatch sous l’espace de noms AWS/EKS. Pour plus d’informations, consultez Surveillance basique et surveillance détaillée dans le Guide de l’utilisateur Amazon CloudWatch. Pour obtenir des métriques, des visualisations et des informations plus détaillées, consultez Container Insights dans le Guide de l’utilisateur Amazon CloudWatch. Si vous préférez la surveillance basée sur Prometheus, consultez Surveiller les métriques de votre cluster avec Prometheus.
Le tableau suivant décrit les métriques disponibles.
| Métrique | Description |
|---|---|
|
Demandes APIServer |
Nombre de demandes par minute effectuées au serveur API. |
|
Demandes APIServer totales 4XX |
Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 4XX (erreurs côté client). |
|
Demandes totales au serveur API 5XX |
Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 5XX (erreurs côté serveur). |
|
Demandes totales au serveur API 429 |
Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 429 (trop de demandes). |
|
Taille de stockage |
Taille de la base de données de stockage ( |
|
Tentatives du planificateur |
Nombre de tentatives de planification de pods par résultats « non planifiable », « erreur » et « planifié ». |
|
Pods en attente |
Nombre de pods en attente par type de file d’attente « actif », « reprise », « non planifiable » et « protégé ». |
|
Latence des demandes du serveur API |
Latence des demandes du serveur API. |
|
Demandes en cours du serveur API |
Demandes en cours du serveur API. |
|
Demandes Webhook |
Nombre de demandes Webhook par minute. |
|
Rejets de demandes Webhook |
Nombre de demandes Webhook rejetées. |
|
Latence des demandes Webhook P99 |
Latence au 99e centile des demandes Webhook externes provenant de tiers. |
CloudWatch Log Insights
La section CloudWatch Log Insights affiche diverses listes basées sur les journaux d’audit du plan de contrôle. Les journaux du plan de contrôle Amazon EKS doivent être activés pour utiliser cette fonctionnalité, ce que vous pouvez faire à partir de la section Afficher les journaux du plan de contrôle dans CloudWatch.
Une fois que suffisamment de temps s’est écoulé pour collecter les données, vous pouvez Exécuter toutes les requêtes ou choisir Exécuter la requête pour une seule liste à la fois. Des frais supplémentaires seront facturés par CloudWatch chaque fois que vous exécuterez des requêtes. Sélectionnez la période pour laquelle vous voulez afficher les résultats en haut de la section. Si vous souhaitez un contrôle plus avancé pour n’importe quelle requête, vous pouvez choisir Afficher dans CloudWatch. Cela vous permettra de mettre à jour une requête dans CloudWatch en fonction de vos besoins.
Pour plus d’informations, consultez Analyse des données de journalisation avec CloudWatch Logs Insights dans le Guide de l’utilisateur Amazon CloudWatch Logs.
Afficher les journaux du plan de contrôle dans CloudWatch
Sélectionnez Gérer la journalisation pour mettre à jour les types de journaux disponibles. Une fois la journalisation activée, plusieurs minutes sont nécessaires pour que les journaux apparaissent dans CloudWatch Logs. Une fois ce délai écoulé, sélectionnez l’un des liens Afficher de cette section pour accéder au journal correspondant.
Pour de plus amples informations, consultez Envoyer les journaux du plan de contrôle à CloudWatch Logs.
Informations sur les clusters
Le tableau Informations sur la mise à niveau met en évidence les problèmes et recommande des mesures correctives, ce qui accélère le processus de validation pour mettre à niveau vers les nouvelles versions de Kubernetes. Amazon EKS analyse automatiquement les clusters par rapport à une liste de problèmes potentiels liés à la mise à niveau de la version de Kubernetes. Le tableau Informations sur la mise à niveau répertorie les vérifications effectuées par Amazon EKS sur ce cluster, ainsi que leur statut associé.
Amazon EKS tient à jour et actualise périodiquement la liste des vérifications d’informations à effectuer en fonction des évaluations des modifications apportées au projet Kubernetes ainsi que des modifications du service Amazon EKS liées aux nouvelles versions. La console Amazon EKS actualise automatiquement le statut de chaque information, qui peut être consulté dans la colonne « Dernière actualisation ».
Pour de plus amples informations, consultez Préparation aux mises à niveau des versions Kubernetes et résolution des erreurs de configuration grâce aux informations sur les clusters.
Problèmes d’intégrité des nœuds
L’agent de surveillance des nœuds Amazon EKS lit automatiquement les journaux des nœuds pour détecter les problèmes d’intégrité. Quel que soit le paramètre de réparation automatique, tous les problèmes d’intégrité des nœuds sont signalés afin que vous puissiez les examiner si nécessaire. Si un type de problème est répertorié mais pas décrit, vous pouvez lire la description dans son élément de fenêtre contextuelle.
Lorsque vous actualisez la page, tous les problèmes résolus disparaissent de la liste. Si la réparation automatique est activée, vous pouvez rencontrer temporairement des problèmes d’intégrité qui seront résolus sans action de votre part. Les problèmes qui ne sont pas pris en charge par la réparation automatique peuvent nécessiter une action manuelle de votre part, selon leur nature.
Pour que les problèmes de santé des nœuds soient signalés, votre cluster doit utiliser le mode automatique Amazon EKS ou disposer du module complémentaire d’agent de surveillance des nœuds. Pour de plus amples informations, consultez Activer la réparation automatique des nœuds et étudier les problèmes d’intégrité de ces derniers.