Unterstützung für die Verbesserung dieser Seite beitragen
Um zu diesem Benutzerhandbuch beizutragen, klicken Sie auf den Link Diese Seite auf GitHub bearbeiten, der sich im rechten Bereich jeder Seite befindet.
Integritätsstatus Ihrer Knoten anzeigen
In diesem Thema werden die Tools und Methoden beschrieben, die zur Überwachung des Zustands von Knoten in Amazon-EKS-Clustern verfügbar sind. Die Informationen umfassen Knotenbedingungen, Ereignisse und Erkennungsfälle, die Sie bei der Identifizierung und Diagnose von Problemen auf Knotenebene unterstützen. Verwenden Sie die hier beschriebenen Befehle und Muster, um die Ressourcen für den Knotenstatus zu überprüfen, Statusbedingungen zu interpretieren und Knotenereignisse für die Fehlerbehebung im Betrieb zu analysieren.
Mit Kubernetes-Befehlen können Sie einige Informationen zum Knotenzustand für alle Knoten abrufen. Wenn Sie den Knoten-Überwachungsagent über den Amazon EKS Auto Mode oder das verwaltete Amazon-EKS-Add-On verwenden, erhalten Sie eine größere Auswahl an Knotensignalen, die Ihnen bei der Fehlerbehebung helfen. Beschreibungen der vom Knoten-Überwachungsagent erkannten Integritätsprobleme werden auch im Dashboard zur Beobachtbarkeit angezeigt. Weitere Informationen finden Sie unter Aktivieren der automatischen Knoten-Reparatur und untersuchen von Problemen mit dem Zustand des Knotens .
Knotenzustände
Knotenzustände stellen terminale Probleme dar, die Abhilfemaßnahmen wie den Austausch oder Neustart einer Instance erfordern.
So rufen Sie die Zustände für alle Knoten ab:
kubectl get nodes -o 'custom-columns=NAME:.metadata.name,CONDITIONS:.status.conditions[*].type,STATUS:.status.conditions[*].status'
So erhalten Sie detaillierte Bedingungen für einen bestimmten Knoten
kubectl describe nodenode-name
Beispiel für die Ausgabe des Zustands eines fehlerfreien Knotens:
- lastHeartbeatTime: "2024-11-21T19:07:40Z" lastTransitionTime: "2024-11-08T03:57:40Z" message: Monitoring for the Networking system is active reason: NetworkingIsReady status: "True" type: NetworkingReady
Beispiel für den Zustand eines fehlerhaften Knotens mit einem Netzwerkproblem:
- lastHeartbeatTime: "2024-11-21T19:12:29Z" lastTransitionTime: "2024-11-08T17:04:17Z" message: IPAM-D has failed to connect to API Server which could be an issue with IPTable rules or any other network configuration. reason: IPAMDNotReady status: "False" type: NetworkingReady
Knotenereignisse
Knotenereignisse weisen auf vorübergehende Probleme oder nicht optimale Konfigurationen hin.
So rufen Sie alle vom Knoten-Überwachungsagenten gemeldeten Ereignisse ab
Wenn der Knoten-Überwachungsagent verfügbar ist, können Sie den folgenden Befehl ausführen.
kubectl get events --field-selector=reportingComponent=eks-node-monitoring-agent
Beispielausgabe:
LAST SEEN TYPE REASON OBJECT MESSAGE 4s Warning SoftLockup node/ip-192-168-71-251.us-west-2.compute.internal CPU stuck for 23s
So erhalten Sie Ereignisse für alle Knoten
kubectl get events --field-selector involvedObject.kind=Node
So rufen Sie Ereignisse für einen bestimmten Knoten ab
kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=node-name
So beobachten Sie Ereignisse in Echtzeit
kubectl get events -w --field-selector involvedObject.kind=Node
Beispiel für eine Ereignisausgabe:
LAST SEEN TYPE REASON OBJECT MESSAGE 2m Warning MemoryPressure Node/node-1 Node experiencing memory pressure 5m Normal NodeReady Node/node-1 Node became ready
Gängige Befehle zur Fehlerbehebung
# Get comprehensive node status kubectl get nodenode-name-o yaml # Watch node status changes kubectl get nodes -w # Get node metrics kubectl top node