Résumé État du cluster Surveillance du plan de contrôle Informations sur le cluster Problèmes d’état du nœud Fonctionnalités d'EKS

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour contribuer à ce guide de l'utilisateur, cliquez sur le GitHub lien Modifier cette page sur qui se trouve dans le volet droit de chaque page.

Surveillez votre cluster à l’aide du tableau de bord d’observabilité

La console Amazon EKS comprend un tableau de bord d’observabilité qui offre une visibilité sur les performances de votre cluster. Les informations qu’il fournit vous aident à détecter, dépanner et résoudre rapidement les problèmes. Vous pouvez ouvrir la section applicable du tableau de bord d’observabilité en sélectionnant un élément dans le Résumé de l’état et des performances. Ce résumé est inclus à plusieurs endroits, notamment dans l’onglet Observabilité.

Le tableau de bord d’observabilité est divisé en plusieurs onglets.

Résumé

Le Résumé de l’état de santé et des performances répertorie la quantité d’articles dans différentes catégories. Chaque numéro agit comme un lien hypertexte vers un emplacement du tableau de bord d’observabilité contenant une liste pour cette catégorie.

État du cluster

L’état du cluster fournit des notifications importantes à prendre en compte, dont certaines peuvent nécessiter une action immédiate de votre part. Cette liste vous permet de consulter les descriptions et les ressources concernées. L’état du cluster comprend deux tableaux : Problèmes d’état et Informations sur la configuration. Pour actualiser le statut des Problèmes d’état, cliquez sur le bouton d’actualisation ( ↻ ). Les Informations sur la configuration sont mises à jour automatiquement toutes les 24 h et ne peuvent pas être actualisées manuellement.

Pour plus d’informations sur les Problèmes d’état, consultez Questions fréquentes (FAQ) sur l’état du cluster et codes d’erreur avec chemins de résolution. Pour plus d’informations sur les Informations sur la configuration, consultez Préparation aux mises à niveau des versions Kubernetes et résolution des erreurs de configuration grâce aux informations sur les clusters.

Surveillance du plan de contrôle

L’onglet Surveillance du plan de contrôle est divisé en trois sections, chacune vous aidant à surveiller et à dépanner le plan de contrôle de votre cluster.

Métriques

Pour les clusters Kubernetes version 1.28 et supérieure, la section Métriques affiche des graphiques de plusieurs métriques recueillies pour divers composants du plan de contrôle.

Vous pouvez définir la période utilisée par chaque graphique en effectuant des sélections en haut de la section. X-axis Vous pouvez actualiser les données à l’aide du bouton d’actualisation ( ↻ ). Pour chaque graphique distinct, le bouton représentant des ellipses verticales (1) ouvre un menu contenant les options de CloudWatch.

Ces métriques et bien d'autres sont automatiquement disponibles CloudWatch sous forme de métriques de surveillance de base dans l'espace de AWS/EKS noms. Pour plus d'informations, consultez les sections Surveillance de base et surveillance détaillée dans le guide de CloudWatch l'utilisateur Amazon. Pour obtenir des statistiques, des visualisations et des informations plus détaillées, consultez Container Insights dans le guide de CloudWatch l'utilisateur Amazon. Si vous préférez la surveillance basée sur Prometheus, consultez Surveiller les métriques de votre cluster avec Prometheus.

Le tableau suivant décrit les métriques disponibles.

Métrique	Description
Demandes APIServer	Nombre de demandes par minute effectuées au serveur API.
Demandes APIServer totales 4XX	Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 4XX (erreurs côté client).
Demandes totales au serveur API 5XX	Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 5XX (erreurs côté serveur).
Demandes totales au serveur API 429	Nombre de demandes au serveur API par minute ayant reçu des codes de réponse HTTP 429 (trop de demandes).
Taille de stockage	Taille de la base de données de stockage (`etcd`).
Tentatives du planificateur	Le nombre de tentatives de planification des modules en fonction des résultats « non planifiable », « erreur » et « planifié ».
Pods en attente	Nombre de pods en attente par type de file d’attente « actif », « reprise », « non planifiable » et « protégé ».
Latence des demandes du serveur API	Latence des demandes du serveur API.
Demandes en cours du serveur API	Demandes en cours du serveur API.
Demandes Webhook	Nombre de demandes Webhook par minute.
Rejets de demandes Webhook	Nombre de demandes Webhook rejetées.
Latence des demandes Webhook P99	Latence au 99e centile des demandes Webhook externes provenant de tiers.

CloudWatch Informations sur les journaux

La section CloudWatch Log Insights affiche différentes listes basées sur les journaux d'audit du plan de contrôle. Les journaux du plan de contrôle Amazon EKS doivent être activés pour utiliser cette fonctionnalité, ce que vous pouvez faire dans la section Afficher les journaux du plan de contrôle dans la CloudWatch section Afficher les journaux du plan de contrôle.

Une fois que suffisamment de temps s’est écoulé pour collecter les données, vous pouvez Exécuter toutes les requêtes ou choisir Exécuter la requête pour une seule liste à la fois. Des frais supplémentaires seront facturés CloudWatch chaque fois que vous lancerez des requêtes. Sélectionnez la période pour laquelle vous voulez afficher les résultats en haut de la section. Si vous souhaitez un contrôle plus avancé pour n'importe quelle requête, vous pouvez choisir Afficher dans CloudWatch. Cela vous permettra de mettre à jour une requête CloudWatch en fonction de vos besoins.

Pour plus d'informations, consultez Analyser les données des CloudWatch journaux avec Logs Insights dans le guide de l'utilisateur Amazon CloudWatch Logs.

Afficher les connexions au plan de contrôle CloudWatch

Sélectionnez Gérer la journalisation pour mettre à jour les types de journaux disponibles. Plusieurs minutes sont nécessaires pour que les journaux apparaissent dans CloudWatch les journaux une fois que vous avez activé la journalisation. Une fois ce délai écoulé, sélectionnez l’un des liens Afficher de cette section pour accéder au journal correspondant.

Pour de plus amples informations, veuillez consulter Envoyer les journaux du plan de contrôle à CloudWatch Logs.

Informations sur le cluster

Le tableau Informations sur la mise à niveau met en évidence les problèmes et recommande des mesures correctives, ce qui accélère le processus de validation pour mettre à niveau vers les nouvelles versions de Kubernetes. Amazon EKS analyse automatiquement les clusters par rapport à une liste de problèmes potentiels liés à la mise à niveau de la version de Kubernetes. Le tableau Informations sur la mise à niveau répertorie les vérifications effectuées par Amazon EKS sur ce cluster, ainsi que leur statut associé.

Amazon EKS tient à jour et actualise périodiquement la liste des vérifications d’informations à effectuer en fonction des évaluations des modifications apportées au projet Kubernetes ainsi que des modifications du service Amazon EKS liées aux nouvelles versions. La console Amazon EKS actualise automatiquement le statut de chaque information, qui peut être consulté dans la colonne « Dernière actualisation ».

Pour de plus amples informations, veuillez consulter Préparation aux mises à niveau des versions Kubernetes et résolution des erreurs de configuration grâce aux informations sur les clusters.

Problèmes d’état du nœud

L’agent de surveillance des nœuds Amazon EKS lit automatiquement les journaux des nœuds pour détecter les problèmes d’état. Quel que soit le paramètre de réparation automatique, tous les problèmes d’état des nœuds sont signalés afin que vous puissiez les examiner si nécessaire. Si un type de problème est répertorié mais pas décrit, vous pouvez lire la description dans son élément de fenêtre contextuelle.

Lorsque vous actualisez la page, tous les problèmes résolus disparaissent de la liste. Si la réparation automatique est activée, vous pouvez rencontrer temporairement des problèmes d’état qui seront résolus sans action de votre part. Les problèmes qui ne sont pas pris en charge par la réparation automatique peuvent nécessiter une action manuelle de votre part, selon leur nature.

Pour que les problèmes d’état des nœuds soient signalés, votre cluster doit utiliser le mode automatique Amazon EKS ou disposer du module complémentaire d’agent de surveillance des nœuds. Pour de plus amples informations, veuillez consulter Détectez les problèmes de santé des nœuds et activez la réparation automatique des nœuds.

Fonctionnalités d'EKS

La section Capabilities indique l'état et l'état de santé de vos ressources EKS Capability dans le cluster. Les notifications relatives à l'état et à l'état des deux fonctionnalités et de leurs ressources Kubernetes gérées dans votre cluster peuvent être surveillées ici. Lorsque vous actualisez la page, tous les problèmes résolus disparaissent de la liste.

Pour de plus amples informations, veuillez consulter Utilisation des ressources en matière de capacités.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Grappes de moniteurs

Observabilité du réseau de conteneurs