Agente di monitoraggio del nodo Riparazione automatica dei nodi

Contribuisci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Rileva i problemi di integrità dei nodi e abilita la riparazione automatica dei nodi

Lo stato del nodo si riferisce allo stato operativo e alla capacità di un nodo Kubernetes di eseguire efficacemente i carichi di lavoro. Un nodo integro mantiene la connettività di rete prevista, dispone di risorse di elaborazione e archiviazione sufficienti e può eseguire con successo i carichi di lavoro senza interruzioni.

Per aiutare a mantenere i nodi integri nei cluster EKS, EKS offre l'agente di monitoraggio dei nodi e la riparazione automatica dei nodi. Queste funzionalità vengono abilitate automaticamente con EKS Auto Mode Compute. È inoltre possibile utilizzare la riparazione automatica dei nodi con i gruppi di nodi gestiti da EKS e Karpenter e utilizzare l'agente di monitoraggio dei nodi EKS con qualsiasi tipo di elaborazione EKS ad eccezione di Fargate. AWS L'agente di monitoraggio dei nodi EKS e la riparazione automatica dei nodi sono più efficaci se usati insieme, ma possono anche essere usati singolarmente nei cluster EKS.

Importante

L’agente di monitoraggio dei nodi e la riparazione automatica dei nodi sono disponibili solo su Linux. Queste funzionalità non sono disponibili su Windows.

Agente di monitoraggio del nodo

L'agente di monitoraggio dei nodi EKS legge i log dei nodi per rilevare problemi di salute. Analizza i log per rilevare i guasti e fornisce informazioni sullo stato di salute dei nodi. Per ogni categoria di problemi rilevati, l'agente ne applica uno dedicato NodeCondition ai nodi di lavoro. Per informazioni dettagliate sui problemi di integrità dei nodi rilevati dall'agente di monitoraggio dei nodi EKS, vedereRileva i problemi di integrità dei nodi con l'agente di monitoraggio dei nodi EKS.

Il calcolo in modalità automatica di EKS include l'agente di monitoraggio dei nodi. Per altri tipi di elaborazione EKS, puoi aggiungere l'agente di monitoraggio dei nodi come componente aggiuntivo EKS o gestirlo con strumenti Kubernetes come Helm. Per ulteriori informazioni, consulta Configura l'agente di monitoraggio del nodo.

Con l'agente di monitoraggio dei nodi EKS, le seguenti categorie di problemi di integrità dei nodi vengono evidenziate come condizioni del nodo. Nota, ReadyDiskPressure, e MemoryPressure sono condizioni standard dei nodi Kubernetes che vengono rilevate anche senza l'agente di monitoraggio dei nodi EKS.

Condizione del nodo	Description
AcceleratedHardwareReady	AcceleratedHardwareReady indica se l'hardware accelerato (GPU, Neuron) sul nodo funziona correttamente.
ContainerRuntimeReady	ContainerRuntimeReady indica se il runtime del contenitore (containerd, ecc.) funziona correttamente ed è in grado di eseguire contenitori.
DiskPressure	DiskPressure è una condizione standard di Kubernetes che indica che il nodo sta subendo una pressione sul disco (spazio su disco insufficiente o I/O elevato).
KernelReady	KernelReady indica se il kernel funziona correttamente senza errori critici, attacchi di panico o esaurimento delle risorse.
MemoryPressure	MemoryPressure è una condizione standard di Kubernetes che indica che il nodo sta subendo una pressione della memoria (memoria disponibile insufficiente).
NetworkingReady	NetworkingReady indica se lo stack di rete del nodo funziona correttamente (interfacce, routing, connettività).
StorageReady	StorageReady indica se il sottosistema di archiviazione del nodo funziona correttamente (dischi, file system, I/O).
Pronto	Ready è la condizione standard di Kubernetes che indica che il nodo è integro e pronto ad accettare i pod.

Riparazione automatica dei nodi

La riparazione automatica dei nodi EKS monitora continuamente lo stato dei nodi, reagisce ai problemi rilevati e sostituisce o riavvia i nodi quando possibile. Ciò migliora l'affidabilità del cluster con un intervento manuale minimo e aiuta a ridurre i tempi di inattività delle applicazioni.

Di per sé, la riparazione automatica dei nodi EKS reagisce alle Ready condizioni del kubelet, a tutti gli oggetti del nodo eliminati manualmente e alle istanze del gruppo di nodi gestite da EKS che non riescono a unirsi al cluster. Quando la riparazione automatica dei nodi EKS è abilitata con l'agente di monitoraggio dei nodi installato, la riparazione automatica dei nodi EKS reagisce a condizioni aggiuntive del nodo:AcceleratedHardwareReady,,, ContainerRuntimeReady e. KernelReady NetworkingReady StorageReady

La riparazione automatica dei nodi EKS non reagisce a Kubernetes DiskPressure standard o alle condizioni dei nodi. MemoryPressure PIDPressure Queste condizioni spesso indicano problemi relativi al comportamento dell'applicazione, alla configurazione del carico di lavoro o ai limiti delle risorse piuttosto che errori a livello di nodo, il che rende difficile determinare un'azione di riparazione predefinita appropriata. In questi scenari, i carichi di lavoro sono soggetti al comportamento di eliminazione della pressione dei nodi Kubernetes.

Per ulteriori informazioni sulla riparazione automatica dei nodi EKS, consulta. Ripara automaticamente i nodi nei cluster EKS

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Compilazioni personalizzate

Rilevamento dello stato dei nodi