Monitora il tuo cluster con la dashboard di osservabilità - Amazon EKS

Aiutaci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitora il tuo cluster con la dashboard di osservabilità

La console Amazon EKS include una dashboard di osservabilità che offre visibilità sulle prestazioni del cluster. Le informazioni che fornisce ti aiutano a rilevare, risolvere e risolvere rapidamente i problemi. Puoi aprire la sezione applicabile del dashboard di osservabilità scegliendo un elemento nel riepilogo di Health and Performance. Questo riepilogo è incluso in diversi punti, inclusa la scheda Osservabilità.

La dashboard di osservabilità è suddivisa in diverse schede.

Riepilogo

Il riepilogo Health and performance elenca la quantità di articoli in varie categorie. Ogni numero funge da collegamento ipertestuale a una posizione nel dashboard di osservabilità con un elenco per quella categoria.

Stato del cluster

Lo stato del cluster fornisce notifiche importanti di cui essere a conoscenza, alcune delle quali potrebbe essere necessario intervenire il prima possibile. Con questo elenco, puoi vedere le descrizioni e le risorse interessate. Lo stato del cluster include due tabelle: Health issues e Configuration Insights. Per aggiornare lo stato dei problemi di Health, scegli il pulsante di aggiornamento (□). Le informazioni sulla configurazione si aggiornano automaticamente una volta ogni 24 ore e non possono essere aggiornate manualmente.

Per ulteriori informazioni sui problemi di Health, vedereIntegrità del cluster FAQs e codici di errore con percorsi di risoluzione. Per ulteriori informazioni su Configuration Insights, consultaPreparati agli aggiornamenti delle versioni di Kubernetes e risolvi gli errori di configurazione con Cluster Insights.

Monitoraggio del piano di controllo

La scheda di monitoraggio del piano di controllo è suddivisa in tre sezioni, ognuna delle quali consente di monitorare e risolvere i problemi del piano di controllo del cluster.

Metriche

Per i cluster con versione Kubernetes 1.28 e successive, la sezione Metriche mostra i grafici di diverse metriche raccolte per vari componenti del piano di controllo.

È possibile impostare il periodo di tempo utilizzato dall'asse X di ogni grafico effettuando le selezioni nella parte superiore della sezione. È possibile aggiornare i dati con il pulsante di aggiornamento (□). Per ogni grafico separato, il pulsante con le ellissi verticali (⋮) apre un menu con le opzioni di. CloudWatch

Queste e altre metriche sono automaticamente disponibili come metriche di monitoraggio di base nel CloudWatch namespace. AWS/EKS Per ulteriori informazioni, consulta la sezione Monitoraggio di base e monitoraggio dettagliato nella Amazon CloudWatch User Guide. Per ottenere metriche, visualizzazioni e approfondimenti più dettagliati, consulta Container Insights nella Amazon CloudWatch User Guide. Oppure, se preferisci il monitoraggio basato su Prometheus, consulta. Monitora le metriche del tuo cluster con Prometheus

La tabella seguente descrive le metriche disponibili.

Parametro Descrizione

APIServer Richieste

Le richieste al minuto inviate al server API.

APIServer Richieste totali: 4XX

Il numero di richieste al minuto del server API con codici di risposta HTTP 4XX (errori lato client).

APIServer Richieste totali: 5XX

Il numero di richieste al minuto del server API con codici di risposta HTTP 5XX (errori sul lato server).

APIServer Richieste totali: 429

Il numero di richieste al minuto del server API con codici di risposta HTTP 429 (troppe richieste).

Dimensioni dell'archiviazione

La dimensione del database di archiviazione (etcd).

Tentativi dell'utilità di pianificazione

Il numero di tentativi di pianificare i pod in base ai risultati «unschedulable», «error» e «scheduled».

Pod in sospeso

Il numero di pod in sospeso per tipo di coda: «active», «backoff», «unschedulable» e «gated».

Latenza delle richieste del server API

La latenza per le richieste del server API.

Richieste di volo correnti del server API

Le attuali richieste in corso per il server API.

Richieste Webhook

Le richieste webhook al minuto.

Rifiuti delle richieste Webhook

Il numero di richieste webhook che sono state rifiutate.

Latenza della richiesta Webhook P99

La latenza del 99° percentile delle richieste webhook esterne di terze parti.

CloudWatch Log Insights

La sezione CloudWatch Log Insights mostra vari elenchi basati sui log di controllo del piano di controllo. I log del piano di controllo di Amazon EKS devono essere attivati per utilizzare questa funzionalità, che puoi eseguire dalla sezione Visualizza i log del piano di controllo. CloudWatch

Quando è trascorso abbastanza tempo per raccogliere i dati, puoi eseguire tutte le query o scegliere Esegui query per un singolo elenco alla volta. CloudWatch Ogni volta che si eseguono query, verrà addebitato un costo aggiuntivo. Scegli il periodo di tempo dei risultati che desideri visualizzare nella parte superiore della sezione. Se desideri un controllo più avanzato per qualsiasi query, puoi scegliere Visualizza in CloudWatch. Ciò ti consentirà di aggiornare una query in CloudWatch base alle tue esigenze.

Per ulteriori informazioni, consulta Analyzing log data with CloudWatch Logs Insights nella Amazon CloudWatch Logs User Guide.

Visualizza i log del piano di controllo in CloudWatch

Scegli Gestisci la registrazione per aggiornare i tipi di registro disponibili. Dopo aver abilitato la registrazione, sono necessari alcuni minuti prima che i CloudWatch registri vengano visualizzati in Registri. Quando è trascorso un periodo di tempo sufficiente, scegli uno dei collegamenti Visualizza in questa sezione per accedere al registro applicabile.

Per ulteriori informazioni, consulta Invia i registri del piano di controllo ai CloudWatch registri.

Approfondimenti sui cluster

La tabella Upgrade Insights evidenzia i problemi e consiglia azioni correttive, accelerando il processo di convalida per l'aggiornamento alle nuove versioni di Kubernetes. Amazon EKS analizza automaticamente i cluster rispetto a un elenco di potenziali aggiornamenti di versione di Kubernetes che influiscono sui problemi. La tabella Upgrade Insights elenca i controlli approfonditi eseguiti da Amazon EKS su questo cluster, insieme ai relativi stati associati.

Amazon EKS mantiene e aggiorna periodicamente l'elenco dei controlli approfonditi da eseguire in base alle valutazioni delle modifiche al progetto Kubernetes e alle modifiche del servizio Amazon EKS legate alle nuove versioni. La console Amazon EKS aggiorna automaticamente lo stato di ogni analisi, che può essere visualizzato nella colonna relativa all'ora dell'ultimo aggiornamento.

Per ulteriori informazioni, consulta Preparati agli aggiornamenti delle versioni di Kubernetes e risolvi gli errori di configurazione con Cluster Insights.

Problemi di salute dei nodi

L'agente di monitoraggio dei nodi Amazon EKS legge automaticamente i log dei nodi per rilevare problemi di salute. Indipendentemente dall'impostazione di riparazione automatica, tutti i problemi di integrità dei nodi vengono segnalati in modo da poter indagare se necessario. Se un tipo di problema è elencato senza una descrizione, puoi leggere la descrizione nel relativo elemento popover.

Quando aggiorni la pagina, tutti i problemi risolti scompariranno dall'elenco. Se la riparazione automatica è abilitata, potresti vedere temporaneamente alcuni problemi di salute che verranno risolti senza alcun intervento da parte tua. I problemi che non sono supportati dalla riparazione automatica potrebbero richiedere un intervento manuale da parte dell'utente a seconda del tipo.

Per segnalare problemi di integrità dei nodi, il cluster deve utilizzare la modalità automatica di Amazon EKS o disporre del componente aggiuntivo Node Monitoring Agent. Per ulteriori informazioni, consulta Abilita la riparazione automatica del nodo e analizza i problemi di salute del nodo.