Visualizzazione dello stato di integrità dei nodi - Amazon EKS

Contribuisci a migliorare questa pagina

Per contribuire a questa guida per l’utente, seleziona il link Edit this page on GitHub che si trova nel riquadro destro di ogni pagina.

Visualizzazione dello stato di integrità dei nodi

Questo argomento spiega gli strumenti e i metodi disponibili per monitorare lo stato di integrità dei nodi nei cluster Amazon EKS. Le informazioni riguardano le condizioni dei nodi, gli eventi e i casi di rilevamento che aiutano a identificare e diagnosticare problemi a livello di nodo. Utilizza i comandi e gli schemi descritti qui per ispezionare le risorse dello stato dei nodi, interpretare le condizioni dello stato e analizzare gli eventi dei nodi per la risoluzione dei problemi operativi.

Puoi ottenere alcune informazioni sullo stato dei nodi con i comandi Kubernetes per tutti i nodi. E se utilizzi l’agente di monitoraggio dei nodi tramite Amazon EKS Auto Mode o il componente aggiuntivo gestito Amazon EKS, otterrai una più ampia varietà di segnali di nodo per aiutarti a risolvere i problemi. Le descrizioni dei problemi di integrità rilevati dall’agente di monitoraggio dei nodi sono disponibili anche nella dashboard di osservabilità. Per ulteriori informazioni, consulta Abilita la riparazione automatica dei nodi e analizza i problemi di integrità dei nodi.

Condizioni dei nodi

Le condizioni dei nodi rappresentano problemi terminali che richiedono azioni di riparazione come la sostituzione o il riavvio dell’istanza.

Per ottenere le condizioni per tutti i nodi:

kubectl get nodes -o 'custom-columns=NAME:.metadata.name,CONDITIONS:.status.conditions[*].type,STATUS:.status.conditions[*].status'

Per ottenere condizioni dettagliate per un nodo specifico

kubectl describe node node-name

Esempio di output delle condizioni di un nodo integro:

- lastHeartbeatTime: "2024-11-21T19:07:40Z" lastTransitionTime: "2024-11-08T03:57:40Z" message: Monitoring for the Networking system is active reason: NetworkingIsReady status: "True" type: NetworkingReady

Esempio di condizione di un nodo non integro con un problema di rete:

- lastHeartbeatTime: "2024-11-21T19:12:29Z" lastTransitionTime: "2024-11-08T17:04:17Z" message: IPAM-D has failed to connect to API Server which could be an issue with IPTable rules or any other network configuration. reason: IPAMDNotReady status: "False" type: NetworkingReady

Eventi dei nodi

Gli eventi dei nodi indicano problemi temporanei o configurazioni non ottimali.

Per ottenere tutti gli eventi segnalati dall’agente di monitoraggio dei nodi

Quando l’agente di monitoraggio dei nodi è disponibile, puoi eseguire il comando seguente.

kubectl get events --field-selector=reportingComponent=eks-node-monitoring-agent

Output di esempio:

LAST SEEN TYPE REASON OBJECT MESSAGE 4s Warning SoftLockup node/ip-192-168-71-251.us-west-2.compute.internal CPU stuck for 23s

Per ottenere eventi per tutti i nodi

kubectl get events --field-selector involvedObject.kind=Node

Per ottenere eventi per un nodo specifico

kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=node-name

Per osservare gli eventi in tempo reale

kubectl get events -w --field-selector involvedObject.kind=Node

Esempio di output di un evento:

LAST SEEN TYPE REASON OBJECT MESSAGE 2m Warning MemoryPressure Node/node-1 Node experiencing memory pressure 5m Normal NodeReady Node/node-1 Node became ready

Comandi per la risoluzione dei problemi comuni

# Get comprehensive node status kubectl get node node-name -o yaml # Watch node status changes kubectl get nodes -w # Get node metrics kubectl top node