

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Monitoraggio in Amazon EKS
<a name="monitoring"></a>

Il monitoraggio in Amazon EKS offre una visibilità fondamentale sullo stato, le prestazioni e la sicurezza dei carichi di lavoro Kubernetes. Senza un monitoraggio adeguato, si rischiano interruzioni del servizio, violazioni della sicurezza e un utilizzo inefficiente delle risorse che possono influire sulle operazioni aziendali e aumentare i costi. Un monitoraggio efficace consente di identificare e risolvere in modo proattivo i problemi, ottimizzare l'utilizzo delle risorse e mantenere i requisiti di conformità nelle applicazioni containerizzate. Implementando soluzioni di monitoraggio complete, puoi garantire un'elevata disponibilità, rilevare tempestivamente le anomalie e prendere decisioni basate sui dati per scalare e migliorare la tua infrastruttura Amazon EKS.

Questa sezione esplora i vari aspetti del monitoraggio di Amazon EKS, inclusi diversi tipi di monitoraggio, strumenti disponibili e best practice per aiutarti a creare una solida strategia di monitoraggio per il tuo ambiente Kubernetes.

**Topics**
+ [Tipi di monitoraggio](monitoring-types.md)
+ [Tools (Strumenti)](monitoring-tools.md)
+ [Implementazione dell'alta disponibilità](monitoring-ha-setup.md)
+ [Best practice](monitoring-best-practices.md)
+ [Considerazioni avanzate](monitoring-considerations.md)

# Tipi di monitoraggio in Amazon EKS
<a name="monitoring-types"></a>

L'osservabilità efficace in Amazon EKS implica attività di monitoraggio dell'infrastruttura, delle applicazioni e della sicurezza.

## Monitoraggio dell'infrastruttura
<a name="infrastructure"></a>

Il monitoraggio dell'infrastruttura è un componente fondamentale dell'osservabilità di Amazon EKS che fornisce informazioni approfondite sullo stato e le prestazioni degli elementi fondamentali del cluster Kubernetes. Fondamentalmente, consiste nel tracciare i segni vitali dei componenti del piano di controllo e dei nodi di lavoro e garantire che la piattaforma sottostante rimanga stabile ed efficiente.
+ Il **monitoraggio del piano di controllo** è fondamentale perché supervisiona componenti chiave come il server API, il database etcd e lo scheduler. Monitorando la latenza del server API, è possibile identificare rapidamente i rallentamenti prestazionali che potrebbero influire sulla distribuzione delle applicazioni o sulle operazioni di scalabilità. Il monitoraggio delle prestazioni di Etcd verifica che il database di stato del cluster funzioni in modo efficiente e previene problemi di coerenza dei dati che potrebbero influire sull'intero cluster.
+ Il **monitoraggio a livello di nodo** è altrettanto importante perché si concentra sulle risorse di calcolo che eseguono i carichi di lavoro containerizzati. Ciò include il monitoraggio dell'utilizzo della CPU, del consumo di memoria, dell'I/O del disco e delle prestazioni di rete su tutti i nodi di lavoro. La comprensione di queste metriche aiuta a prevenire l'esaurimento delle risorse, a ottimizzare le decisioni sulla scalabilità dei nodi e a garantire un'adeguata pianificazione della capacità.
+ **Il monitoraggio della rete** svolge un ruolo fondamentale nel mantenere una comunicazione affidabile tra pod, servizi e risorse esterne. Monitorando la velocità effettiva, la latenza e gli stati di connessione della rete, è possibile identificare tempestivamente i problemi di connettività e garantire una comunicazione fluida delle applicazioni. Il monitoraggio dello storage integra il monitoraggio della rete monitorando i volumi, le prestazioni, l'utilizzo della capacità e i I/O modelli, per aiutare a prevenire i colli di bottiglia legati ai dati.

Il monitoraggio dell'infrastruttura funge da sistema di allarme rapido per potenziali problemi, consente una manutenzione proattiva e garantisce un'allocazione ottimale delle risorse. Senza un solido monitoraggio dell'infrastruttura, si rischiano tempi di inattività imprevisti, prestazioni ridotte e utilizzo inefficiente delle risorse che possono avere un impatto significativo sulle operazioni e sui costi aziendali.

## Monitoraggio dell'applicazione
<a name="application"></a>

Il monitoraggio delle applicazioni è essenziale per mantenere applicazioni containerizzate sane, performanti e affidabili nel tuo ambiente Amazon EKS. Questo livello di monitoraggio si concentra sui carichi di lavoro effettivi eseguiti all'interno del cluster e fornisce informazioni fondamentali su come le applicazioni si comportano, si comportano e interagiscono con altri servizi.

Il monitoraggio delle applicazioni include il monitoraggio a livello di contenitore, il monitoraggio a livello di servizio e la traccia distribuita.
+ A **livello di container**, il monitoraggio delle applicazioni tiene traccia di parametri cruciali come lo stato di salute dei container, il numero di riavvii e i modelli di consumo delle risorse. Queste metriche aiutano a identificare i contenitori problematici che potrebbero consumare risorse eccessive o subire riavvii frequenti, il che potrebbe indicare problemi di fondo come perdite di memoria o problemi di configurazione. Monitorando gli eventi del ciclo di vita dei container, è possibile garantire il corretto comportamento delle applicazioni e risolvere rapidamente i problemi di distribuzione.
+ **Il monitoraggio a livello di servizio** offre visibilità sulle metriche relative alle prestazioni e all'affidabilità delle applicazioni, come i tempi di risposta, i tassi di errore e il throughput delle richieste. Queste metriche sono fondamentali per mantenere gli obiettivi a livello di servizio (SLOs) e garantire un'esperienza positiva per l'utente finale. È possibile tenere traccia della latenza tra diversi endpoint di servizio, identificare i punti deboli nelle prestazioni e monitorare i modelli di errore per mantenere l'affidabilità delle applicazioni.
+ Il **tracciamento distribuito** è un altro aspetto fondamentale del monitoraggio delle applicazioni, in particolare nelle architetture di microservizi. Implementando il tracciamento, è possibile seguire le richieste mentre fluiscono attraverso diversi servizi, comprendere le dipendenze e identificare i punti deboli in termini di prestazioni. Questa end-to-end visibilità consente di ottimizzare le interazioni con i servizi e risolvere problemi complessi che riguardano più componenti.

Le metriche applicative personalizzate svolgono un ruolo cruciale nel fornire informazioni specifiche per l'azienda. Queste potrebbero includere metriche come i tassi di elaborazione degli ordini, le frequenze di accesso degli utenti o le percentuali di successo delle transazioni. È possibile correlare queste metriche personalizzate con le metriche dell'infrastruttura e dei container per comprendere meglio in che modo le prestazioni dell'infrastruttura influiscono sulle operazioni aziendali e prendere decisioni basate sui dati per la scalabilità e l'ottimizzazione.

L'importanza del monitoraggio delle applicazioni risiede nella sua capacità di fornire una visione completa dello stato e delle prestazioni delle applicazioni. Questo monitoraggio consente di mantenere un'elevata qualità del servizio, risolvere rapidamente i problemi e ottimizzare continuamente le applicazioni per raggiungere gli obiettivi aziendali.

## Controllo della sicurezza
<a name="security"></a>

Il monitoraggio della sicurezza in Amazon EKS è un'attività fondamentale che aiuta le organizzazioni a mantenere l'integrità, la riservatezza e la conformità dei loro ambienti Kubernetes. Questo approccio di sicurezza completo combina sorveglianza continua, rilevamento delle minacce e monitoraggio della conformità per proteggere i carichi di lavoro containerizzati da potenziali rischi per la sicurezza e accessi non autorizzati. Include il monitoraggio dell'autenticazione e delle autorizzazioni, il monitoraggio della sicurezza della rete e il monitoraggio della configurazione e della conformità.
+ Il **monitoraggio dell'autenticazione e delle autorizzazioni** costituisce la prima linea di difesa poiché tiene traccia di tutti i tentativi di accesso al cluster. Ciò include il monitoraggio delle richieste del server API, il monitoraggio dei tentativi di accesso riusciti e falliti e il controllo delle modifiche al controllo degli accessi basato sui ruoli (RBAC). Conservando registri di controllo dettagliati su chi ha avuto accesso a quali risorse e quando, è possibile rilevare rapidamente potenziali violazioni della sicurezza, tentativi di accesso non autorizzati o attività di escalation dei privilegi. Ciò è particolarmente importante negli ambienti multi-tenant in cui è essenziale mantenere rigorosi controlli di accesso.
+ **Il monitoraggio della sicurezza della rete** si concentra sul rilevamento e la prevenzione delle comunicazioni non autorizzate tra pod e servizi. Monitorando le violazioni delle policy di rete e gli schemi di traffico insoliti, è possibile identificare potenziali minacce alla sicurezza, come i tentativi di fuga dei container o i movimenti laterali all'interno del cluster. Ciò include il monitoraggio sia delle comunicazioni interne del cluster che dei modelli di traffico esterno per garantire che i container comunichino solo con gli endpoint autorizzati e seguano le politiche di sicurezza definite.
+ Il **monitoraggio della configurazione e della conformità** è essenziale per mantenere le linee di base di sicurezza e soddisfare i requisiti normativi. Implica la scansione continua delle immagini dei container alla ricerca di vulnerabilità, il monitoraggio della sicurezza in fase di esecuzione e il monitoraggio delle modifiche alla configurazione che potrebbero influire sul livello di sicurezza. I controlli di conformità regolari garantiscono il rispetto degli standard di settore e delle politiche di sicurezza organizzative, mentre il rilevamento delle deviazioni nella configurazione aiuta a prevenire modifiche non autorizzate che potrebbero introdurre rischi per la sicurezza.

Il monitoraggio della sicurezza in Amazon EKS offre la visibilità e il controllo necessari per proteggere dalle moderne minacce alla sicurezza, garantendo al contempo la conformità ai requisiti normativi. Implementando un monitoraggio completo della sicurezza, la tua organizzazione può mantenere un solido livello di sicurezza, rispondere rapidamente agli incidenti di sicurezza e dimostrare la conformità a vari standard normativi.

# Strumenti di monitoraggio per Amazon EKS
<a name="monitoring-tools"></a>

Questa sezione illustra tre categorie di strumenti di monitoraggio Amazon EKS: servizi di AWS monitoraggio, soluzioni open source o proprietarie e strumenti specializzati.

## AWS servizi
<a name="monitoring-services"></a>
+ [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html): servizio completo di monitoraggio e registrazione

  CloudWatch costituisce la spina dorsale delle soluzioni di AWS monitoraggio e offre funzionalità estese per gli ambienti Amazon EKS. Fornisce Container Insights per metriche granulari di container e cluster, in modo da poter monitorare le prestazioni, l'utilizzo delle risorse e lo stato delle applicazioni. Il servizio eccelle nell'aggregazione e nell'analisi dei log e supporta la registrazione centralizzata su contenitori e nodi. CloudWatch si integra naturalmente con. Servizi AWS Fornisce una configurazione automatica degli allarmi e supporta parametri e dashboard personalizzati, che lo rendono uno strumento essenziale per il monitoraggio di Amazon EKS.
+ [AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html): Piattaforma di tracciamento distribuita avanzata

  X-Ray aumenta l'osservabilità fornendo sofisticate funzionalità di tracciamento distribuito. La visualizzazione della mappa dei servizi offre informazioni chiare sull'architettura e sulle dipendenze delle applicazioni, mentre il monitoraggio dettagliato delle richieste aiuta a identificare i punti deboli delle prestazioni tra i servizi. X-Ray è in grado di tracciare le richieste attraverso architetture di microservizi complesse, il che lo rende prezioso per la risoluzione dei problemi e l'ottimizzazione, specialmente nei sistemi distribuiti che si estendono su più piattaforme. Servizi AWS
+ [AWS Distro per: framework di osservabilità unificato OpenTelemetry](https://aws-otel.github.io/)

  Distro for OpenTelemetry offre funzionalità di raccolta dati unificate con supporto multipiattaforma, il che lo rende ideale per ambienti ibridi. Questo servizio si integra con altri Servizi AWS, supporta strumentazione personalizzata e offre flessibilità nell'implementazione di soluzioni di monitoraggio complete pur mantenendo la compatibilità con gli standard del settore.
+ [Amazon Managed Grafana](https://docs.aws.amazon.com/grafana/latest/userguide/what-is-Amazon-Managed-Service-Grafana.html): visualizzazione di livello aziendale

  Amazon Managed Grafana fornisce un servizio completamente gestito per la visualizzazione e l'analisi dei dati. Offre una perfetta integrazione con altre Servizi AWS funzionalità di sicurezza integrate e una scalabilità di livello aziendale. Il servizio semplifica la creazione e la gestione di dashboard fornendo al contempo funzionalità avanzate come l'accesso alla fonte di dati tra account e l'integrazione con. AWS IAM Identity Center
+ [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/what-is-Amazon-Managed-Service-Prometheus.html): monitoraggio gestito, sicuro e ad alta disponibilità

  Amazon Managed Service for Prometheus è un servizio di monitoraggio completamente gestito e compatibile con Prometheus. Fornisce scalabilità automatizzata, elevata disponibilità e acquisizione e interrogazione sicure delle metriche. Il servizio si integra perfettamente con Amazon EKS ed elimina il sovraccarico operativo della gestione dei server Prometheus.

## Soluzioni open source o proprietarie
<a name="monitoring-open-source"></a>

Gli AWS strumenti descritti nella sezione precedente offrono una perfetta integrazione e servizi gestiti. Gli strumenti open source elencati in questa sezione si completano Servizi AWS offrendo flessibilità e ampie opzioni di personalizzazione. Comprendere le funzionalità e i casi d'uso di ogni strumento consente di progettare strategie di monitoraggio che soddisfino al meglio i requisiti specifici.
+ [Prometheus](https://docs.aws.amazon.com/eks/latest/userguide/deploy-prometheus.html): toolkit per la raccolta di metriche

  Prometheus è una soluzione open source per la raccolta di metriche in ambienti Kubernetes. Il suo database di serie temporali e il linguaggio di query PromQL consentono analisi metriche sofisticate. Le funzionalità di rilevamento dei servizi della piattaforma si adattano automaticamente agli ambienti Kubernetes dinamici e il suo sistema di gestione degli avvisi ti tiene informato sulle questioni critiche. Prometheus offre ampie opzioni di integrazione, che lo rendono una scelta versatile per il monitoraggio completo delle metriche.
+ [Grafana: motore](https://grafana.com/docs/grafana-cloud/monitor-infrastructure/kubernetes-monitoring/configuration/config-other-methods/config-aws-eks/) di visualizzazione avanzato

  Grafana trasforma dati di monitoraggio complessi in informazioni fruibili attraverso le sue funzionalità di visualizzazione. La piattaforma crea dashboard personalizzate che combinano dati provenienti da più fonti e forniscono una visione unificata delle metriche dell'infrastruttura e delle applicazioni. Il supporto per varie fonti di dati e le funzionalità di gestione degli avvisi forniscono un monitoraggio completo. Grafana può aiutarti a visualizzare dati storici e in tempo reale, in modo da identificare le tendenze e prendere decisioni informate.
+ [Fluent Bit](https://fluentbit.io/): livello di registrazione unificato

  Questa soluzione di registrazione fornisce la raccolta e la gestione dei log per gli ambienti Kubernetes. La sua integrazione nativa con Kubernetes garantisce una raccolta di log senza interruzioni da contenitori e nodi e il supporto per più destinazioni di output offre flessibilità nell'archiviazione e nell'analisi dei log. Funzionalità avanzate come l'analisi e il filtraggio dei log consentono di elaborare e indirizzare i log in base a requisiti specifici. La natura leggera di Fluent Bit lo rende particolarmente adatto per ambienti containerizzati.
+ [Datadog: osservabilità completa](https://www.datadoghq.com/blog/eks-monitoring-datadog/)

  Datadog offre funzionalità di monitoraggio complete con supporto nativo di Kubernetes. Offre monitoraggio dell'infrastruttura, monitoraggio delle prestazioni delle applicazioni (APM), gestione dei log e analisi in tempo reale. Puoi utilizzare il rilevamento automatico dei servizi e l'ampio catalogo di integrazione della piattaforma per il monitoraggio di Amazon EKS e le sue funzionalità di apprendimento automatico per rilevare anomalie e prevedere potenziali problemi.
+ [New Relic](https://docs.newrelic.com/docs/infrastructure/amazon-integrations/connect/eks-add-on/): monitoraggio delle prestazioni delle applicazioni

  New Relic offre visibilità sulle prestazioni delle applicazioni e sullo stato dell'infrastruttura. La sua integrazione con Kubernetes fornisce informazioni dettagliate sui container, tracciamento distribuito e dashboard personalizzati. La piattaforma consente di correlare le prestazioni delle applicazioni con i parametri dell'infrastruttura, in modo da identificare e risolvere rapidamente i problemi.
+ [Elastic Stack (ELK Stack)](https://aws.amazon.com/opensearch-service/resources/the-benefits-of-the-elk-stack/): analisi e ricerca dei log

  ELK Stack combina Elasticsearch, Logstash e Kibana per fornire funzionalità di gestione e analisi dei log. Offre funzionalità di ricerca avanzate, strumenti di visualizzazione e funzionalità di apprendimento automatico. Puoi utilizzare lo stack per gestire grandi volumi di dati di log dai tuoi ambienti Amazon EKS.

## Strumenti specializzati
<a name="monitoring-special"></a>

È possibile combinare i seguenti strumenti in base ai requisiti di monitoraggio specifici, alla scala delle operazioni e alle preferenze organizzative. La chiave è creare uno stack di monitoraggio che offra una visibilità completa pur rimanendo gestibile ed economico.
+ [kube-state-metrics (KSM](https://github.com/kubernetes/kube-state-metrics)): monitoraggio dello stato di Kubernetes

  Questo servizio aggiuntivo ascolta il server API Kubernetes e genera metriche sullo stato degli oggetti. Fornisce informazioni sullo stato di integrità delle implementazioni, dei pod e di altre risorse Kubernetes.
+ [Kubernetes Metrics Server: metriche delle risorse](https://docs.aws.amazon.com/eks/latest/userguide/metrics-server.html)

  Questo server di metriche raccoglie le metriche delle risorse da Kubelets e le espone tramite l'API Kubernetes Metrics. Fornisce la scalabilità automatica dei pod orizzontali e metriche di base di CPU e memoria.
+ Kubecost: monitoraggio dei costi di [Kubernetes](https://github.com/kubecost/cost-analyzer-helm-chart)

  Strumenti come Kubecost forniscono analisi dettagliate dei costi e consigli di ottimizzazione per i cluster EKS. Ti aiutano a comprendere e ottimizzare la spesa per il cloud su diversi namespace, implementazioni e servizi.

# Implementazione dell'alta disponibilità per le soluzioni di monitoraggio Amazon EKS
<a name="monitoring-ha-setup"></a>

Una solida strategia di alta disponibilità (HA) per il monitoraggio di Amazon EKS è fondamentale per garantire una visibilità continua nel tuo ambiente Kubernetes. Questa sezione illustra un approccio completo all'implementazione dell'HA in diversi aspetti dell'infrastruttura di monitoraggio.

## Ridondanza e scalabilità dell'architettura
<a name="architecture"></a>

La creazione di un sistema di monitoraggio ad alta disponibilità inizia con una corretta progettazione architettonica. I componenti di monitoraggio devono essere distribuiti su più zone di AWS disponibilità per proteggere dai guasti delle zone. Ciò include l'implementazione della scalabilità orizzontale per componenti di monitoraggio critici come server Prometheus, log collector e gestori di avvisi. Puoi utilizzare servizi AWS gestiti come Amazon Managed Service for Prometheus e Amazon Managed Grafana per ridurre il sovraccarico operativo garantendo al contempo un'elevata disponibilità. Configura meccanismi di failover automatici per mantenere la continuità del servizio durante i guasti dei componenti, implementando controlli dello stato e procedure di ripristino automatizzate.

## Strategia di archiviazione dei dati resiliente
<a name="data-storage"></a>

La resilienza dell'archiviazione dei dati è fondamentale per mantenere l'affidabilità del sistema di monitoraggio. L'implementazione di soluzioni di storage distribuite garantisce che i dati e i log metrici rimangano accessibili anche in caso di guasto dei singoli nodi di storage. Ciò include la configurazione della corretta replica dei dati su più zone di disponibilità e l'utilizzo di diversi backend di storage per la ridondanza. Stabilisci procedure di backup regolari per i dati storici, con processi di ripristino documentati per vari scenari di errore. Per i database di serie temporali come Prometheus, l'implementazione di soluzioni di storage remoto aiuta a separare i problemi di archiviazione dalla raccolta dei dati e migliora l'affidabilità complessiva del sistema.

## Gestione ridondante degli avvisi
<a name="alert-mgmt"></a>

La gestione degli avvisi richiede un'attenzione speciale in una configurazione HA. L'implementazione di gestori di avvisi ridondanti garantisce che le notifiche critiche raggiungano i destinatari previsti anche in caso di guasti del sistema. Configura più canali di notifica come e-mail, SMS, Slack e PagerDuty fornisci percorsi di comunicazione alternativi. Utilizza meccanismi di deduplicazione degli avvisi per prevenire tempeste di avvisi durante guasti parziali del sistema e metodi di notifica fallback per garantire che gli avvisi critici non vengano mai persi. L'implementazione della correlazione degli avvisi aiuta a mantenere il contesto durante gli scenari di failover e previene la duplicazione delle notifiche provenienti da sistemi ridondanti.

## Bilanciamento del carico e individuazione dei servizi
<a name="load-balancing"></a>

Un corretto bilanciamento del carico è essenziale per mantenere stabili i servizi di monitoraggio. AWS Gli Application Load Balancer distribuiscono il traffico di monitoraggio in entrata su più endpoint e i controlli di integrità assicurano che il traffico venga indirizzato solo verso istanze integre. I meccanismi di rilevamento dei servizi aiutano i componenti di monitoraggio ad adattarsi automaticamente ai cambiamenti dell'ambiente, come l'aggiunta di nuovi nodi o servizi. Implementa gli agenti di monitoraggio in modo coerente su tutti i nodi utilizzandoli DaemonSets per garantire una copertura completa man mano che il cluster cresce.

## Considerazioni aggiuntive sull'HA
<a name="ha-considerations"></a>

Resilienza della rete:
+ Implementa percorsi di rete ridondanti.
+ Configura la corretta progettazione della sottorete tra le zone di disponibilità.
+ Utilizzare [AWS Direct Connect](https://docs.aws.amazon.com/whitepapers/latest/aws-vpc-connectivity-options/aws-direct-connect.html)con percorsi di backup.
+ Configura i gruppi di sicurezza e gli elenchi di controllo degli accessi alla rete appropriati (rete ACLs).

Monitoraggio dei monitor:
+ Implementa sistemi di monitoraggio secondari.
+ Implementa il monitoraggio interregionale.
+ Configura gli avvisi per i sistemi che non rispondono.
+ Verifica regolarmente le procedure di failover.

Pianificazione della capacità:
+ Monitora le tendenze di utilizzo delle risorse.
+ Implementa la scalabilità predittiva.
+ Verifica regolarmente le prestazioni.

Gestione dei dati:
+ Implementare politiche di conservazione dei dati.
+ Configura l'aggregazione delle metriche.
+ Pianifica la gestione del ciclo di vita dei dati.
+ Ottimizza lo storage su base regolare.

Procedure di ripristino:
+ Processi di recupero dei documenti.
+ Testa regolarmente il disaster recovery.
+ Implementa il ripristino automatico ove possibile.
+ Identifica e implementa percorsi di escalation chiari.

Implementando queste pratiche di alta disponibilità, puoi garantire che la tua infrastruttura di monitoraggio Amazon EKS rimanga affidabile e resiliente e che tu abbia una visibilità continua sui tuoi ambienti Kubernetes anche durante vari scenari di errore. I test e gli aggiornamenti regolari di queste configurazioni HA garantiscono che rimangano efficaci man mano che l'ambiente si evolve.

# Le migliori pratiche per il monitoraggio in Amazon EKS
<a name="monitoring-best-practices"></a>

## Approccio di implementazione strategico
<a name="implementation"></a>

Una strategia di monitoraggio Amazon EKS di successo inizia con un approccio di implementazione ben pianificato e graduale.
+ Inizia identificando e monitorando i parametri critici che influiscono direttamente sulle operazioni aziendali e sull'affidabilità delle applicazioni. Questa base dovrebbe includere i parametri essenziali dell'infrastruttura, gli indicatori chiave delle prestazioni delle applicazioni e i parametri di sicurezza critici. Espandi gradualmente la copertura del monitoraggio in base alle esigenze operative e alle lezioni apprese e assicurati che ogni aggiunta fornisca un valore significativo.
+ Implementa processi di implementazione automatizzati utilizzando strumenti di infrastruttura come codice (IaC) come Terraform o CloudFormation per garantire coerenza e ripetibilità.
+ Testa e convalida i sistemi di monitoraggio per contribuire a mantenere l'affidabilità e la precisione.
+ Perfeziona continuamente i parametri di monitoraggio in linea con le esigenze aziendali in evoluzione.

## Gestione efficace dei dati
<a name="data-mgmt"></a>

Una corretta gestione dei dati è fondamentale per mantenere una soluzione di monitoraggio efficiente ed economica.
+ Implementa politiche chiare di conservazione dei dati che bilanciano le esigenze di analisi storica con i costi di archiviazione.
+ Configura le frequenze di campionamento appropriate per diversi tipi di metriche: frequenza più alta per le metriche critiche e frequenza più bassa per quelle meno critiche.
+ Utilizza l'aggregazione delle metriche per ridurre il volume dei dati mantenendo al contempo informazioni significative, in particolare per l'analisi delle tendenze a lungo termine.
+ Implementa procedure sistematiche di conservazione e archiviazione dei log per sistemi di registrazione centralizzati (come CloudWatch Logs) per gestire i costi di archiviazione e mantenere accessibile l'accesso ai dati importanti.
**Nota**  
La rotazione dei log a livello di contenitore viene gestita automaticamente dal kubelet in Amazon EKS versione 1.21 o successiva.
+ Prendi in considerazione l'implementazione di un' hot-warm-coldarchitettura per l'archiviazione dei log per ottimizzare sia la velocità di accesso che l'efficienza dei costi.

## Configurazione e gestione degli avvisi
<a name="alert-config"></a>

La configurazione degli avvisi richiede un'attenta valutazione per mantenere l'efficacia senza causare affaticamento degli avvisi.
+ Definisci soglie chiare e attuabili in base agli obiettivi dei livelli di servizio (SLOs) e ai modelli prestazionali storici.
+ Implementa un sistema di gravità degli avvisi a più livelli che distingua chiaramente tra questioni critiche che richiedono attenzione immediata e questioni meno urgenti.
+ Assicurati che gli avvisi forniscano un contesto sufficiente e informazioni utilizzabili per facilitare una rapida risoluzione dei problemi.
+ Stabilisci procedure di segnalazione chiare con titolarità e tempi di risposta definiti per diverse gravità degli avvisi.
+ Rivedi e perfeziona regolarmente le configurazioni degli avvisi per mantenerne la pertinenza e l'efficacia.

## Ottimizzazione delle risorse
<a name="resource"></a>

Il monitoraggio continuo dell'utilizzo delle risorse è essenziale per mantenere operazioni convenienti.
+ Implementa il monitoraggio completo delle risorse su tutti i componenti del cluster, inclusi nodi, pod e volumi persistenti.
+ Configura la scalabilità automatica in base ai modelli di utilizzo effettivi e ai requisiti prestazionali per garantire un utilizzo efficiente delle risorse mantenendo al contempo le prestazioni.
+ Utilizza i tag di allocazione dei costi per tenere traccia del consumo di risorse da parte di diversi team, applicazioni o ambienti.
+ Analizza regolarmente le metriche sull'efficienza delle risorse per identificare opportunità di ottimizzazione e implementare miglioramenti.
+ Prendi in considerazione l'implementazione di strumenti di gestione dei costi per tracciare e ottimizzare la spesa per il cloud.

## Sicurezza
<a name="security"></a>

Le considerazioni sulla sicurezza dovrebbero essere parte integrante della tua strategia di monitoraggio.
+ Implementa [i principi di accesso con privilegio minimo](https://docs.aws.amazon.com/wellarchitected/latest/security-pillar/sec_permissions_least_privileges.html) per tutti i componenti di monitoraggio per garantire che utenti e servizi dispongano solo delle autorizzazioni di cui hanno bisogno.
+ Abilita una registrazione di controllo completa per tenere traccia di tutti gli accessi e le modifiche ai sistemi di monitoraggio.
+ Effettua regolari revisioni di sicurezza delle configurazioni di monitoraggio e dei modelli di accesso per identificare potenziali vulnerabilità.
+ Implementa la crittografia per i dati di monitoraggio sensibili sia in transito che a riposo.
+ Integra il monitoraggio della sicurezza con i sistemi SIEM (Security Information and Event Management) esistenti per una visibilità completa della sicurezza.

# Considerazioni sul monitoraggio avanzato in Amazon EKS
<a name="monitoring-considerations"></a>

Ottimizzazione delle prestazioni:
+ Ottimizza gli intervalli di raccolta delle metriche.
+ Configura modelli di interrogazione efficienti.
+ Implementa la preaggregazione delle metriche.
+ Utilizza soluzioni di storage appropriate.

Conformità e governance:
+ Mantieni gli audit trail.
+ Implementa il monitoraggio della conformità.
+ Fornisci rapporti di conformità regolari.
+ Procedure di monitoraggio dei documenti.

Ripristino di emergenza:
+ Esegui regolarmente il backup delle configurazioni di monitoraggio.
+ Procedure di recupero dei documenti.
+ Test dei processi di ripristino.

Miglioramento continuo:
+ Monitora regolarmente le sessioni di revisione.
+ Ottimizza i cicli di prestazioni.
+ Aggiorna il monitoraggio in base agli incidenti.
+ Incorpora il feedback degli utenti.

Queste best practice forniscono un framework per l'implementazione e il mantenimento di soluzioni di monitoraggio efficaci per gli ambienti Amazon EKS. Rivedi e aggiorna regolarmente queste pratiche in modo che rimangano in linea con le esigenze organizzative e gli standard di settore. Il monitoraggio non è una configurazione una tantum, è un processo continuo che richiede un'attenzione e un perfezionamento regolari.