Contribuisci a migliorare questa pagina
Per contribuire a questa guida per l’utente, seleziona il link Edit this page on GitHub che si trova nel riquadro destro di ogni pagina.
Visualizzazione dello stato di integrità dei nodi
Questo argomento spiega gli strumenti e i metodi disponibili per monitorare lo stato di integrità dei nodi nei cluster Amazon EKS. Le informazioni riguardano le condizioni dei nodi, gli eventi e i casi di rilevamento che aiutano a identificare e diagnosticare problemi a livello di nodo. Utilizza i comandi e gli schemi descritti qui per ispezionare le risorse dello stato dei nodi, interpretare le condizioni dello stato e analizzare gli eventi dei nodi per la risoluzione dei problemi operativi.
Puoi ottenere alcune informazioni sullo stato dei nodi con i comandi Kubernetes per tutti i nodi. E se utilizzi l’agente di monitoraggio dei nodi tramite Amazon EKS Auto Mode o il componente aggiuntivo gestito Amazon EKS, otterrai una più ampia varietà di segnali di nodo per aiutarti a risolvere i problemi. Le descrizioni dei problemi di integrità rilevati dall’agente di monitoraggio dei nodi sono disponibili anche nella dashboard di osservabilità. Per ulteriori informazioni, consulta Abilita la riparazione automatica dei nodi e analizza i problemi di integrità dei nodi.
Condizioni dei nodi
Le condizioni dei nodi rappresentano problemi terminali che richiedono azioni di riparazione come la sostituzione o il riavvio dell’istanza.
Per ottenere le condizioni per tutti i nodi:
kubectl get nodes -o 'custom-columns=NAME:.metadata.name,CONDITIONS:.status.conditions[*].type,STATUS:.status.conditions[*].status'
Per ottenere condizioni dettagliate per un nodo specifico
kubectl describe nodenode-name
Esempio di output delle condizioni di un nodo integro:
- lastHeartbeatTime: "2024-11-21T19:07:40Z" lastTransitionTime: "2024-11-08T03:57:40Z" message: Monitoring for the Networking system is active reason: NetworkingIsReady status: "True" type: NetworkingReady
Esempio di condizione di un nodo non integro con un problema di rete:
- lastHeartbeatTime: "2024-11-21T19:12:29Z" lastTransitionTime: "2024-11-08T17:04:17Z" message: IPAM-D has failed to connect to API Server which could be an issue with IPTable rules or any other network configuration. reason: IPAMDNotReady status: "False" type: NetworkingReady
Eventi dei nodi
Gli eventi dei nodi indicano problemi temporanei o configurazioni non ottimali.
Per ottenere tutti gli eventi segnalati dall’agente di monitoraggio dei nodi
Quando l’agente di monitoraggio dei nodi è disponibile, puoi eseguire il comando seguente.
kubectl get events --field-selector=reportingComponent=eks-node-monitoring-agent
Output di esempio:
LAST SEEN TYPE REASON OBJECT MESSAGE 4s Warning SoftLockup node/ip-192-168-71-251.us-west-2.compute.internal CPU stuck for 23s
Per ottenere eventi per tutti i nodi
kubectl get events --field-selector involvedObject.kind=Node
Per ottenere eventi per un nodo specifico
kubectl get events --field-selector involvedObject.kind=Node,involvedObject.name=node-name
Per osservare gli eventi in tempo reale
kubectl get events -w --field-selector involvedObject.kind=Node
Esempio di output di un evento:
LAST SEEN TYPE REASON OBJECT MESSAGE 2m Warning MemoryPressure Node/node-1 Node experiencing memory pressure 5m Normal NodeReady Node/node-1 Node became ready
Comandi per la risoluzione dei problemi comuni
# Get comprehensive node status kubectl get nodenode-name-o yaml # Watch node status changes kubectl get nodes -w # Get node metrics kubectl top node