Aiutaci a migliorare questa pagina
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitora il tuo cluster con la dashboard di osservabilità
La console Amazon EKS include una dashboard di osservabilità che offre visibilità sulle prestazioni del cluster. Le informazioni che fornisce ti aiutano a rilevare, risolvere e risolvere rapidamente i problemi. Puoi aprire la sezione applicabile del dashboard di osservabilità scegliendo un elemento nel riepilogo di Health and Performance. Questo riepilogo è incluso in diversi punti, inclusa la scheda Osservabilità.
La dashboard di osservabilità è suddivisa in diverse schede.
Riepilogo
Il riepilogo Health and performance elenca la quantità di articoli in varie categorie. Ogni numero funge da collegamento ipertestuale a una posizione nel dashboard di osservabilità con un elenco per quella categoria.
Stato del cluster
Lo stato del cluster fornisce notifiche importanti di cui essere a conoscenza, alcune delle quali potrebbe essere necessario intervenire il prima possibile. Con questo elenco, puoi vedere le descrizioni e le risorse interessate. Lo stato del cluster include due tabelle: Health issues e Configuration Insights. Per aggiornare lo stato dei problemi di Health, scegli il pulsante di aggiornamento (□). Le informazioni sulla configurazione si aggiornano automaticamente una volta ogni 24 ore e non possono essere aggiornate manualmente.
Per ulteriori informazioni sui problemi di Health, vedereIntegrità del cluster FAQs e codici di errore con percorsi di risoluzione. Per ulteriori informazioni su Configuration Insights, consultaPreparati agli aggiornamenti delle versioni di Kubernetes e risolvi gli errori di configurazione con Cluster Insights.
Monitoraggio del piano di controllo
La scheda di monitoraggio del piano di controllo è suddivisa in tre sezioni, ognuna delle quali consente di monitorare e risolvere i problemi del piano di controllo del cluster.
Metriche
Per i cluster con versione Kubernetes 1.28
e successive, la sezione Metriche mostra i grafici di diverse metriche raccolte per vari componenti del piano di controllo.
È possibile impostare il periodo di tempo utilizzato dall'asse X di ogni grafico effettuando le selezioni nella parte superiore della sezione. È possibile aggiornare i dati con il pulsante di aggiornamento (□). Per ogni grafico separato, il pulsante con le ellissi verticali (⋮) apre un menu con le opzioni di. CloudWatch
Queste e altre metriche sono automaticamente disponibili come metriche di monitoraggio di base nel CloudWatch namespace. AWS/EKS
Per ulteriori informazioni, consulta la sezione Monitoraggio di base e monitoraggio dettagliato nella Amazon CloudWatch User Guide. Per ottenere metriche, visualizzazioni e approfondimenti più dettagliati, consulta Container Insights nella Amazon CloudWatch User Guide. Oppure, se preferisci il monitoraggio basato su Prometheus, consulta. Monitora le metriche del tuo cluster con Prometheus
La tabella seguente descrive le metriche disponibili.
Parametro | Descrizione |
---|---|
APIServer Richieste |
Le richieste al minuto inviate al server API. |
APIServer Richieste totali: 4XX |
Il numero di richieste al minuto del server API con codici di risposta HTTP 4XX (errori lato client). |
APIServer Richieste totali: 5XX |
Il numero di richieste al minuto del server API con codici di risposta HTTP 5XX (errori sul lato server). |
APIServer Richieste totali: 429 |
Il numero di richieste al minuto del server API con codici di risposta HTTP 429 (troppe richieste). |
Dimensioni dell'archiviazione |
La dimensione del database di archiviazione ( |
Tentativi dell'utilità di pianificazione |
Il numero di tentativi di pianificare i pod in base ai risultati «unschedulable», «error» e «scheduled». |
Pod in sospeso |
Il numero di pod in sospeso per tipo di coda: «active», «backoff», «unschedulable» e «gated». |
Latenza delle richieste del server API |
La latenza per le richieste del server API. |
Richieste di volo correnti del server API |
Le attuali richieste in corso per il server API. |
Richieste Webhook |
Le richieste webhook al minuto. |
Rifiuti delle richieste Webhook |
Il numero di richieste webhook che sono state rifiutate. |
Latenza della richiesta Webhook P99 |
La latenza del 99° percentile delle richieste webhook esterne di terze parti. |
CloudWatch Log Insights
La sezione CloudWatch Log Insights mostra vari elenchi basati sui log di controllo del piano di controllo. I log del piano di controllo di Amazon EKS devono essere attivati per utilizzare questa funzionalità, che puoi eseguire dalla sezione Visualizza i log del piano di controllo. CloudWatch
Quando è trascorso abbastanza tempo per raccogliere i dati, puoi eseguire tutte le query o scegliere Esegui query per un singolo elenco alla volta. CloudWatch Ogni volta che si eseguono query, verrà addebitato un costo aggiuntivo. Scegli il periodo di tempo dei risultati che desideri visualizzare nella parte superiore della sezione. Se desideri un controllo più avanzato per qualsiasi query, puoi scegliere Visualizza in CloudWatch. Ciò ti consentirà di aggiornare una query in CloudWatch base alle tue esigenze.
Per ulteriori informazioni, consulta Analyzing log data with CloudWatch Logs Insights nella Amazon CloudWatch Logs User Guide.
Visualizza i log del piano di controllo in CloudWatch
Scegli Gestisci la registrazione per aggiornare i tipi di registro disponibili. Dopo aver abilitato la registrazione, sono necessari alcuni minuti prima che i CloudWatch registri vengano visualizzati in Registri. Quando è trascorso un periodo di tempo sufficiente, scegli uno dei collegamenti Visualizza in questa sezione per accedere al registro applicabile.
Per ulteriori informazioni, consulta Invia i registri del piano di controllo ai CloudWatch registri.
Approfondimenti sui cluster
La tabella Upgrade Insights evidenzia i problemi e consiglia azioni correttive, accelerando il processo di convalida per l'aggiornamento alle nuove versioni di Kubernetes. Amazon EKS analizza automaticamente i cluster rispetto a un elenco di potenziali aggiornamenti di versione di Kubernetes che influiscono sui problemi. La tabella Upgrade Insights elenca i controlli approfonditi eseguiti da Amazon EKS su questo cluster, insieme ai relativi stati associati.
Amazon EKS mantiene e aggiorna periodicamente l'elenco dei controlli approfonditi da eseguire in base alle valutazioni delle modifiche al progetto Kubernetes e alle modifiche del servizio Amazon EKS legate alle nuove versioni. La console Amazon EKS aggiorna automaticamente lo stato di ogni analisi, che può essere visualizzato nella colonna relativa all'ora dell'ultimo aggiornamento.
Per ulteriori informazioni, consulta Preparati agli aggiornamenti delle versioni di Kubernetes e risolvi gli errori di configurazione con Cluster Insights.
Problemi di salute dei nodi
L'agente di monitoraggio dei nodi Amazon EKS legge automaticamente i log dei nodi per rilevare problemi di salute. Indipendentemente dall'impostazione di riparazione automatica, tutti i problemi di integrità dei nodi vengono segnalati in modo da poter indagare se necessario. Se un tipo di problema è elencato senza una descrizione, puoi leggere la descrizione nel relativo elemento popover.
Quando aggiorni la pagina, tutti i problemi risolti scompariranno dall'elenco. Se la riparazione automatica è abilitata, potresti vedere temporaneamente alcuni problemi di salute che verranno risolti senza alcun intervento da parte tua. I problemi che non sono supportati dalla riparazione automatica potrebbero richiedere un intervento manuale da parte dell'utente a seconda del tipo.
Per segnalare problemi di integrità dei nodi, il cluster deve utilizzare la modalità automatica di Amazon EKS o disporre del componente aggiuntivo Node Monitoring Agent. Per ulteriori informazioni, consulta Abilita la riparazione automatica del nodo e analizza i problemi di salute del nodo.