Riepilogo Integrità del cluster Monitoraggio del piano di controllo Approfondimenti sui cluster Problemi di integrità dei nodi Funzionalità EKS

Contribuisci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitora il tuo cluster con la dashboard di osservabilità

La console Amazon EKS include una dashboard di osservabilità che offre visibilità nelle prestazioni del cluster. Le informazioni che fornisce aiutano a rilevare, risolvere e chiarire rapidamente i problemi. È possibile aprire la sezione applicabile del dashboard di osservabilità scegliendo un elemento nel Riepilogo di integrità e prestazioni. Questo riepilogo è incluso in diversi punti, inclusa la scheda Osservabilità.

La dashboard di osservabilità è suddivisa in diverse schede.

Riepilogo

Il riepilogo dello stato e delle prestazioni elenca la quantità di articoli in varie categorie. Ciascun numero funge da collegamento ipertestuale a una posizione nella dashboard di osservabilità con un elenco per quella categoria.

Integrità del cluster

L’integrità del cluster fornisce notifiche importanti di cui essere a conoscenza, su alcune delle quali potrebbe essere necessario intervenire il prima possibile. Con questo elenco, è possibile vedere le descrizioni e le risorse interessate. Lo stato del cluster include due tabelle: Problemi di integrità e Approfondimenti sulla configurazione. Per aggiornare lo stato dei Problemi di integrità, scegli il pulsante di aggiornamento ( ↻ ). Gli Approfondimenti sulla configurazione si aggiornano automaticamente una volta ogni 24 ore e non possono essere aggiornate manualmente.

Per ulteriori informazioni sui Problemi di integrità, consulta Domande frequenti sull’integrità del cluster e codici di errore con percorsi di risoluzione. Per ulteriori informazioni su Approfondimenti sulla configurazione, consulta Prepararsi agli aggiornamenti delle versioni di Kubernetes e risolvere i problemi di configurazione errata con gli approfondimenti sui cluster.

Monitoraggio del piano di controllo

La scheda Monitoraggio del piano di controllo è divisa in tre sezioni, ognuna delle quali aiuta a monitorare e risolvere i problemi del piano di controllo del cluster.

Metriche

Per i cluster con versione Kubernetes 1.28 e successive, la sezione Metriche mostra grafici di diverse metriche raccolte per vari componenti del piano di controllo.

Puoi impostare il periodo X-axis di tempo utilizzato da ogni grafico effettuando le selezioni nella parte superiore della sezione. È possibile aggiornare i dati con il pulsante di aggiornamento ( ↻ ). Per ogni grafico separato, il pulsante con le ellissi verticali (⋮) apre un menu con le opzioni di. CloudWatch

Queste e altre metriche sono automaticamente disponibili come metriche di monitoraggio di base nel CloudWatch namespace. AWS/EKS Per ulteriori informazioni, consulta la sezione Monitoraggio di base e monitoraggio dettagliato nella Amazon CloudWatch User Guide. Per ottenere metriche, visualizzazioni e approfondimenti più dettagliati, consulta Container Insights nella Amazon CloudWatch User Guide. Oppure, se si preferisce un monitoraggio basato su Prometheus, consulta Monitoraggio delle metriche del cluster con Prometheus.

La tabella seguente descrive le metriche disponibili.

Metrica	Description
Richieste APIServer	Le richieste al minuto effettuate al server API.
Richieste totali 4XX del server API	Il numero di richieste al minuto del server API con codici di risposta HTTP 4XX (errori lato client).
Richieste totali 5XX del server API	Il numero di richieste al minuto del server API con codici di risposta HTTP 5XX (errori lato server).
Richieste totali 429 del server API	Il numero di richieste al minuto del server API con codici di risposta HTTP 429 (troppe richieste).
Dimensioni dell’archiviazione	La dimensione del database di archiviazione (`etcd`).
Tentativi del sistema di pianificazione	Il numero di tentativi di pianificare i pod in base ai risultati «unschedulable», «error» e «scheduled».
Pod in sospeso	Il numero di pod in sospeso per tipo di coda di “attivo”, “backoff”, “non pianificabile” e “limitato”.
Latenza delle richieste del server API	La latenza per le richieste del server API.
Richieste correnti del server API	Le richieste correnti per il server API.
Richieste webhook	Le richieste webhook al minuto.
Rifiuti delle richieste webhook	Il numero di richieste webhook che sono state rifiutate.
Latenza della richiesta webhook P99	La latenza del 99° percentile delle richieste webhook esterne di terze parti.

CloudWatch Log Insights

La sezione CloudWatch Log Insights mostra vari elenchi basati sui log di controllo del piano di controllo. I log del piano di controllo di Amazon EKS devono essere attivati per utilizzare questa funzionalità, che puoi eseguire dalla sezione Visualizza i log del piano di controllo. CloudWatch

Quando è trascorso abbastanza tempo per raccogliere i dati, è possibile Eseguire tutte le query o scegliere Esegui query per un singolo elenco alla volta. Verranno addebitati costi aggiuntivi a partire da CloudWatch ogni richiesta. Nella parte superiore della sezione, scegli il periodo di tempo dei risultati che desideri visualizzare. Se desideri un controllo più avanzato per qualsiasi query, puoi scegliere Visualizza in. CloudWatch Ciò ti consentirà di aggiornare una query in CloudWatch base alle tue esigenze.

Per ulteriori informazioni, consulta Analyzing log data with CloudWatch Logs Insights nella Amazon CloudWatch Logs User Guide.

Visualizza i log del piano di controllo in CloudWatch

Per aggiornare i tipi di log disponibili, scegli Gestisci log. Dopo aver abilitato la registrazione, occorrono alcuni minuti prima che i log vengano visualizzati in CloudWatch Logs. Quando è trascorso tempo sufficiente, scegli uno dei link Visualizza in questa sezione per accedere al log applicabile.

Per ulteriori informazioni, consulta Invia i registri del piano di controllo ai CloudWatch registri.

Approfondimenti sui cluster

La tabella Migliora approfondimenti fa emergere i problemi e consiglia azioni correttive, accelerando il processo di convalida per l’aggiornamento a nuove versioni di Kubernetes. Amazon EKS esegue automaticamente la scansione dei cluster e li mette a confronto con un elenco di potenziali problemi di aggiornamento della versione Kubernetes. La tabella Migliora approfondimenti elenca i controlli approfonditi eseguiti da Amazon EKS su questo cluster, insieme ai relativi stati associati.

Amazon EKS gestisce e aggiorna periodicamente l’elenco dei controlli degli approfondimenti da eseguire sulla base delle valutazioni delle modifiche nel progetto Kubernetes e delle modifiche al servizio Amazon EKS legate alle nuove versioni. La console Amazon EKS aggiorna automaticamente lo stato di ciascun approfondimento, che può essere visualizzato nella colonna relativa all’ora dell’ultimo aggiornamento.

Per ulteriori informazioni, consulta Prepararsi agli aggiornamenti delle versioni di Kubernetes e risolvere i problemi di configurazione errata con gli approfondimenti sui cluster.

Problemi di integrità dei nodi

L’agente di monitoraggio dei nodi Amazon EKS legge automaticamente i log dei nodi per rilevare problemi di integrità. Indipendentemente dall’impostazione di riparazione automatica, vengono segnalati tutti i problemi di integrità dei nodi in modo da poterli esaminare se necessario. Se un tipo di problema è elencato senza una descrizione, è possibile leggere la descrizione nel relativo elemento popover.

Quando si aggiorna la pagina, tutti i problemi risolti scompariranno dall’elenco. Se la riparazione automatica è abilitata, potresti visualizzare temporaneamente alcuni problemi di integrità che verranno risolti senza intervento da parte dell’utente. I problemi non supportati dalla riparazione automatica potrebbero richiedere un’azione manuale da parte dell’utente a seconda del tipo.

Per segnalare problemi di integrità dei nodi, il cluster deve utilizzare la modalità automatica Amazon EKS o disporre del componente aggiuntivo dell’agente di monitoraggio dei nodi. Per ulteriori informazioni, consulta Rileva i problemi di integrità dei nodi e abilita la riparazione automatica dei nodi.

Funzionalità EKS

La sezione Capacità mostra lo stato e lo stato delle risorse EKS Capability nel cluster. Le notifiche sullo stato e sullo stato di entrambe le funzionalità e le relative risorse Kubernetes gestite nel cluster possono essere monitorate qui. Quando si aggiorna la pagina, tutti i problemi risolti scompariranno dall’elenco.

Per ulteriori informazioni, consulta Lavorare con le risorse di capacità.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Monitoraggio dei cluster

Osservabilità della rete di container