Überwachen Ihres Clusters im Dashboard „Beobachtbarkeit“ - Amazon EKS

Unterstützung für die Verbesserung dieser Seite beitragen

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Um zu diesem Benutzerhandbuch beizutragen, wählen Sie den GitHub Link Diese Seite bearbeiten auf, der sich im rechten Bereich jeder Seite befindet.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen Ihres Clusters im Dashboard „Beobachtbarkeit“

Die Amazon-EKS-Konsole enthält ein Beobachtbarkeits-Dashboard, das Einblick in die Leistung Ihres Clusters bietet. Die darin enthaltenen Informationen helfen Ihnen, Probleme schnell zu erkennen, zu beheben und zu lösen. Sie können den entsprechenden Abschnitt des Beobachtbarkeits-Dashboards öffnen, indem Sie einen Eintrag in der Zusammenfassung zu Zustand und Leistung auswählen. Diese Zusammenfassung ist an mehreren Stellen enthalten, darunter auch auf der Registerkarte Beobachtbarkeit.

Das Dashboard zur Beobachtbarkeit ist in mehrere Registerkarten unterteilt.

Zusammenfassung

In der Zusammenfassung zu Integrität und Leistung wird die Anzahl der Elemente in verschiedenen Kategorien aufgeführt. Jede Zahl dient als Hyperlink zu einer Stelle im Dashboard Beobachtbarkeit mit einer Liste für diese Kategorie.

Cluster-Integrität

Cluster-Integrität liefert wichtige Benachrichtigungen, die Sie beachten sollten. Bei einigen davon müssen Sie möglicherweise so schnell wie möglich Maßnahmen ergreifen. In dieser Liste finden Sie Beschreibungen und die betroffenen Ressourcen. Cluster-Integrität besteht aus zwei Tabellen: Integritätsprobleme und Konfigurationserkenntnisse. Um den Status der Integritätsprobleme zu aktualisieren, klicken Sie auf die Schaltfläche „Aktualisieren“ ( ↻ ). Konfigurationserkenntnisse werden automatisch alle 24 Stunden aktualisiert und können nicht manuell aktualisiert werden

Weitere Informationen zu Integritätsprobleme finden Sie unter Häufig gestellte Fragen zur Cluster-Integrität und Fehlercodes mit Lösungspfaden. Weitere Informationen zu Konfigurationserkenntnisse finden Sie unter Vorbereitung auf Kubernetes-Versionsupgrades und Beheben von Fehlkonfigurationen mit Cluster-Einblicken.

Überwachen der Steuerebene

Die Registerkarte Überwachung der Steuerebene ist in drei Abschnitte unterteilt, die Ihnen jeweils bei der Überwachung und Fehlerbehebung der Steuerebene Ihres Clusters behilflich sind.

Metriken

Für Cluster mit Kubernetes-Version 1.28 und höher werden im Abschnitt „Metriken“ Diagramme mit verschiedenen Metriken angezeigt, die für verschiedene Komponenten der Steuerebene erfasst wurden.

Sie können den Zeitbereich für die X-Achse jedes Diagramms festlegen, indem Sie oben im Abschnitt eine Auswahl treffen. Mit der Schaltfläche „Aktualisieren“ (↻) können Sie die Daten aktualisieren. Für jedes einzelne Diagramm öffnet die Schaltfläche mit den vertikalen Ellipsen () ein Menü mit Optionen von CloudWatch.

Diese und weitere Metriken sind automatisch als grundlegende Überwachungsmetriken CloudWatch unter dem AWS/EKS Namespace verfügbar. Weitere Informationen finden Sie unter Grundlegende Überwachung und detaillierte Überwachung im CloudWatch Amazon-Benutzerhandbuch. Ausführlichere Metriken, Visualisierungen und Einblicke finden Sie unter Container Insights im CloudWatch Amazon-Benutzerhandbuch. Wenn Sie eine Prometheus-basierte Überwachung bevorzugen, lesen Sie Überwachung Ihrer Cluster-Metriken mit Prometheus.

In der folgenden Tabelle werden die verfügbaren Metriken beschrieben.

Metrik Description

APIServer Anfragen

Die Anzahl der Anfragen pro Minute, die an den API-Server gestellt werden.

APIServer Gesamtzahl der Anfragen 4XX

Die Anzahl der API-Serveranfragen pro Minute, die HTTP-4XX-Antwortcodes (clientseitige Fehler) aufwiesen.

APIServer Gesamtzahl der Anfragen 5XX

Die Anzahl der API-Serveranfragen pro Minute, die HTTP-5XX-Antwortcodes (serverseitige Fehler) aufwiesen.

APIServer Gesamtzahl der Anfragen 429

Die Anzahl der API-Serveranfragen pro Minute mit HTTP-429-Antwortcodes (zu viele Anfragen).

Speichergröße

Die Größe der Speicherdatenbank (etcd).

Scheduler-Versuche

Die Anzahl der Versuche, Pods zu planen, nach den Ergebnissen „nicht planbar“, „Fehler“ und „geplant“.

Ausstehende Pods

Die Anzahl der ausstehenden Pods nach Warteschlangentyp „aktiv“, „Backoff“, „nicht planbar“ und „gesperrt“.

Latenzzeit bei API-Serveranfragen

Die Latenzzeit für API-Serveranfragen.

Aktuelle laufende Anfragen an den API-Server

Die aktuellen laufenden Anfragen für den API-Server.

Webhook-Anfragen

Die Webhook-Anfragen pro Minute.

Abgelehnte Webhook-Anfragen

Die Anzahl der abgelehnten Webhook-Anfragen.

Latenzzeit bei Webhook-Anfragen P99

Die 99. Perzentil-Latenzzeit von externen Webhook-Anfragen von Drittanbietern.

CloudWatch Einblicke protokollieren

Im Abschnitt CloudWatch Log Insights werden verschiedene Listen angezeigt, die auf den Auditprotokollen der Kontrollebene basieren. Die Amazon EKS-Steuerebenenprotokolle müssen aktiviert sein, um diese Funktion nutzen zu können. Dies können Sie im CloudWatch Abschnitt Kontrollebenenprotokolle anzeigen im tun.

Sobald ausreichend Zeit für die Datenerfassung vergangen ist, können Sie Alle Abfragen ausführen oder die Option Abfrage für eine einzelne Liste ausführen wählen. Jedes Mal, CloudWatch wenn Sie Abfragen ausführen, fallen zusätzliche Kosten an. Wählen Sie oben in diesem Abschnitt den Zeitraum aus, für den Sie die Ergebnisse anzeigen möchten. Wenn Sie eine erweiterte Steuerung für eine Abfrage wünschen, können Sie „Anzeigen in CloudWatch“ wählen. Auf diese Weise können Sie eine Abfrage CloudWatch an Ihre Bedürfnisse anpassen.

Weitere Informationen finden Sie unter Analysieren von Protokolldaten mit CloudWatch Logs Insights im Amazon CloudWatch Logs-Benutzerhandbuch.

Logs auf der Kontrollebene anzeigen CloudWatch

Wählen Sie Protokollierung verwalten, um die verfügbaren Protokolltypen zu aktualisieren. Nachdem Sie die Protokollierung aktiviert haben, dauert es einige Minuten, bis die CloudWatch Protokolle in den Protokollen angezeigt werden. Wenn ausreichend Zeit verstrichen ist, wählen Sie einen der Links Anzeigen in diesem Abschnitt, um zum entsprechenden Protokoll zu navigieren.

Weitere Informationen finden Sie unter Übermittlung von Steuerebenen-Protokollen an CloudWatch Logs.

Cluster-Erkenntnisse

Die Tabelle Upgrade-Erkenntnisse zeigt sowohl Probleme auf und empfiehlt Korrekturmaßnahmen, wodurch der Validierungsprozess für das Upgrade auf neue Kubernetes-Versionen beschleunigt wird. Amazon EKS scannt Cluster automatisch anhand einer Liste potenzieller Probleme, die sich auf das Upgrade der Kubernetes-Version auswirken könnten. Die Tabelle Upgrade-Erkenntnisse listet die von Amazon EKS für diesen Cluster durchgeführten Erkenntnisprüfungen zusammen mit den zugehörigen Statusmeldungen auf.

Amazon EKS verwaltet und aktualisiert regelmäßig die Liste der Prüfungen, die auf der Grundlage von Bewertungen der Änderungen im Kubernetes-Projekt sowie der Amazon-EKS-Serviceänderungen im Zusammenhang mit neuen Versionen durchgeführt werden müssen. Die Amazon-EKS-Konsole aktualisiert automatisch den Status jeder Erkenntnis, der in der Spalte „Letzte Aktualisierungszeit“ angezeigt wird.

Weitere Informationen finden Sie unter Vorbereitung auf Kubernetes-Versionsupgrades und Beheben von Fehlkonfigurationen mit Cluster-Einblicken.

Probleme mit dem Zustand des Knotens

Der Amazon-EKS-Knotenüberwachungsagent liest automatisch Knotenprotokolle, um Zustandsprobleme zu erkennen. Unabhängig von der Einstellung für die automatische Reparatur werden alle Probleme mit der Knoten-Integrität gemeldet, sodass Sie diese bei Bedarf untersuchen können. Wenn ein Problemtyp ohne Beschreibung aufgeführt ist, finden Sie die Beschreibung in dem zugehörigen Popover-Element.

Wenn Sie die Seite aktualisieren, werden alle gelösten Probleme aus der Liste entfernt. Wenn die automatische Reparatur aktiviert ist, können vorübergehend einige Integritätsprobleme gemeldet werden, die ohne Ihr Eingreifen behoben werden. Probleme, die von der automatischen Reparatur nicht unterstützt werden, erfordern je nach Art möglicherweise manuelles Eingreifen.

Damit Probleme mit der Knotenintegrität gemeldet werden, muss Ihr Cluster Amazon EKS Auto Mode verwenden oder über das Add-On für den Knoten-Überwachungsagenten verfügen. Weitere Informationen finden Sie unter Aktivieren der automatischen Knotenreparatur und Untersuchen von Problemen mit dem Zustand des Knotens.

EKS-Funktionen

Im Abschnitt Capabilities werden der Status und der Zustand Ihrer EKS-Capability-Ressourcen im Cluster angezeigt. Integritäts- und Statusbenachrichtigungen für beide Funktionen und ihre verwalteten Kubernetes-Ressourcen in Ihrem Cluster können hier überwacht werden. Wenn Sie die Seite aktualisieren, werden alle gelösten Probleme aus der Liste entfernt.

Weitere Informationen finden Sie unter Mit Capability-Ressourcen arbeiten.