# OPS 8 Come fai a comprendere lo stato del tuo carico di lavoro?
<a name="ops-08"></a>

 Definisci, acquisisci e analizza i parametri del carico di lavoro per ottenere visibilità sugli eventi del carico di lavoro, in modo da intraprendere le azioni appropriate. 

**Topics**
+ [OPS08-BP01 Identificazione degli indicatori chiave di prestazione](ops_workload_health_define_workload_kpis.md)
+ [OPS08-BP02 Definizione delle metriche del carico di lavoro](ops_workload_health_design_workload_metrics.md)
+ [OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro](ops_workload_health_collect_analyze_workload_metrics.md)
+ [OPS08-BP04 Definizione di valori di riferimento per le metriche del carico di lavoro](ops_workload_health_workload_metric_baselines.md)
+ [OPS08-BP05 Studio dei modelli di attività previsti per il carico di lavoro](ops_workload_health_learn_workload_usage_patterns.md)
+ [OPS08-BP06 Attivazione di un avviso quando i risultati del carico di lavoro sono a rischio](ops_workload_health_workload_outcome_alerts.md)
+ [OPS08-BP07 Attivazione di un avviso quando vengono rilevate delle anomalie nel carico di lavoro](ops_workload_health_workload_anomaly_alerts.md)
+ [OPS08-BP08 Convalida del raggiungimento dei risultati e dell'efficacia dei KPI e dei parametri](ops_workload_health_biz_level_view_workload.md)

# OPS08-BP01 Identificazione degli indicatori chiave di prestazione
<a name="ops_workload_health_define_workload_kpis"></a>

 Identifica gli indicatori chiave delle prestazioni (KPI) in base ai risultati aziendali desiderati (ad esempio, tasso di ordini, tasso di conservazione dei clienti e profitti rispetto alle spese operative) e ai risultati dei clienti (ad esempio, soddisfazione dei clienti). Valuta i KPI per determinare il successo del carico di lavoro. 

 **Anti-pattern comuni:** 
+  I dirigenti aziendali ti chiedono in che modo un carico di lavoro sia stato in grado di soddisfare le esigenze aziendali, ma non disponi di un quadro di riferimento per determinare il successo. 
+  Non sei in grado di stabilire se l'applicazione pronta all'uso commerciale utilizzata per la tua organizzazione è conveniente. 

 **Vantaggi dell'adozione di questa best practice:** Identificando indicatori chiave delle prestazioni, puoi ottenere risultati aziendali da utilizzare come test dello stato e del successo del carico di lavoro. 

 **Livello di rischio associato se questa best practice non fosse adottata:** Alta 

## Guida all'implementazione
<a name="implementation-guidance"></a>
+  Identificazione degli indicatori chiave di prestazione: identifica gli indicatori chiave di prestazione (KPI) basati su risultati attesi in termini di business e clienti. Valuta i KPI per determinare il successo del carico di lavoro. 

# OPS08-BP02 Definizione delle metriche del carico di lavoro
<a name="ops_workload_health_design_workload_metrics"></a>

Definisci le metriche per la misurazione dell'integrità del carico di lavoro. L'integrità del carico di lavoro viene misurata attraverso il raggiungimento dei risultati aziendali (KPI) e lo stato dei componenti e delle applicazioni del carico di lavoro. Esempi di KPI sono i carrelli abbandonati, gli ordini effettuati, i costi, i prezzi e la spesa allocata per il carico di lavoro. Anche se puoi raccogliere dati di telemetria da più componenti, scegli un sottoinsieme in grado di fornire informazioni dettagliate sull'integrità complessiva del carico di lavoro. Modifica le metriche del carico di lavoro nel corso del tempo in base al mutare delle esigenze aziendali. 

 **Risultato desiderato:** 
+  Identificazione delle metriche per la convalida della realizzazione dei KPI che riflettono i risultati aziendali. 
+  Presenza di metriche che mostrano una visione coerente dell'integrità del carico di lavoro. 
+  Valutazione periodica delle metriche del carico di lavoro in base al mutare delle esigenze aziendali. 

 **Anti-pattern comuni:** 
+ Tutte le applicazioni nel carico di lavoro vengono monitorate, ma senza riuscire a determinare se il carico di lavoro sia in grado di raggiungere i risultati aziendali.
+ Sono state definite metriche del carico di lavoro, ma senza associarle ad alcun KPI aziendale.

 **Vantaggi dell'adozione di questa best practice:** 
+  Possibilità di misurare il carico di lavoro rispetto alla realizzazione dei risultati aziendali. 
+  Capacità di determinare se il carico di lavoro è integro o necessita di interventi. 

 **Livello di rischio associato alla mancata adozione di questa best practice:** elevato 

## Guida all'implementazione
<a name="implementation-guidance"></a>

 L'obiettivo della best practice è rispondere a questa domanda: il carico di lavoro è integro? L'integrità del carico di lavoro viene misurata attraverso il raggiungimento dei risultati aziendali e lo stato dei componenti e delle applicazioni nel carico di lavoro. Procedi a ritroso dai KPI aziendali per identificare le metriche. Identifica le metriche principali dai componenti e dalle applicazioni. Esamina periodicamente le metriche del carico di lavoro in base al mutare delle esigenze aziendali. 

 **Esempio del cliente** 

 Presso AnyCompany Retail l'integrità del carico di lavoro viene determinata tramite una raccolta di metriche per le applicazioni e i componenti. Partendo dai KPI aziendali, vengono identificate metriche come la percentuale di ordini che indicano la realizzazione dei risultati aziendali. L'azienda include anche importanti metriche delle applicazioni, come la risposta delle pagine, e dei componenti, come le connessioni di database aperte. Ogni trimestre l'azienda rivaluta le metriche del carico di lavoro per verificare che siano ancora valide nel determinare l'integrità del carico di lavoro. 

 **Passaggi dell'implementazione** 

1.  Partendo dai KPI aziendali, identifica le metriche che indicano la realizzazione dei risultati aziendali. Se per alcuni KPI non sono disponibili metriche, esegui la strumentazione del carico di lavoro con metriche aggiuntive per i KPI aziendali mancanti. 

   1.  Puoi pubblicare metriche personalizzate dall'applicazione in [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html). 

   1.  [AWS Distro per OpenTelemetry](https://aws-otel.github.io/) può raccogliere metriche da applicazioni esistenti e aggiungerne di nuove. 

   1.  I clienti con un piano di supporto Enterprise possono richiedere il [workshop sulla creazione di una strategia di monitoraggio](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) al proprio Technical Account Manager. Questo workshop aiuta a creare una strategia di visibilità per il carico di lavoro. 

1.  Identifica le metriche per le applicazioni e i componenti nel carico di lavoro. Quali sono le principali metriche che indicano l'integrità di singoli componenti e applicazioni? Anche se applicazioni e componenti possono generare molte metriche diverse, scegli da una a tre metriche in grado di indicare l'integrità complessiva. 

1.  Implementa un meccanismo per valutare periodicamente le metriche del carico di lavoro. Quando i KPI aziendali cambiano, collabora con gli stakeholder per aggiornare le metriche del carico di lavoro. Con l'evolvere dei componenti e delle applicazioni del carico di lavoro, modifica le metriche di conseguenza. 

 **Livello di impegno per il piano di implementazione:** medio. L'aggiunta di metriche per KPI aziendali alle applicazioni può richiedere un impegno moderato. 

## Risorse
<a name="resources"></a>

 **Best practice correlate:** 
+  [OPS04-BP01 Implementazione della telemetria dell'applicazione](ops_telemetry_application_telemetry.md) – L'applicazione deve emettere dati di telemetria per supportare i risultati aziendali. 
+  [OPS04-BP02 Implementazione e configurazione della telemetria del carico di lavoro](ops_telemetry_workload_telemetry.md) – Devi eseguire la strumentazione del carico di lavoro per emettere dati di telemetria prima di poter definire le metriche del carico di lavoro che supportano i risultati aziendali. 
+  [OPS08-BP01 Identificazione degli indicatori chiave di prestazione](ops_workload_health_define_workload_kpis.md) – Devi identificare gli indicatori chiave di prestazioni prima di selezionare le metriche del carico di lavoro. 

 **Documenti correlati:** 
+ [ Aggiunta di metriche e tracce all'applicazione in Amazon EKS con AWS Distro per OpenTelemetry, AWS X-Ray e Amazon CloudWatch ](https://aws.amazon.com/blogs/mt/adding-metrics-and-traces-to-your-application-on-amazon-eks-with-aws-distro-for-opentelemetry-aws-x-ray-and-amazon-cloudwatch/)
+ [Strumentazione di sistemi distribuiti per visibilità operativa](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/)
+ [implementazione dei controlli dello stato](https://aws.amazon.com/builders-library/implementing-health-checks/)
+ [Come monitorare le applicazioni in modo efficace](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [Come monitorare meglio le metriche personalizzate dell'applicazione usando l'agente Amazon CloudWatch ](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/)

 **Video correlati:** 
+ [AWS re:Invent 2020: Monitoraggio dei servizi di produzione in Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw)
+ [AWS re:Invent 2022: Creazione di applicazioni osservabili con OpenTelemetry (BOA310) ](https://www.youtube.com/watch?v=efk8XFJrW2c)
+ [ Come configurare facilmente il monitoraggio dell'applicazione per i carichi di lavoro AWS – AWS Online Tech Talks](https://www.youtube.com/watch?v=LKCth30RqnA)
+ [ Controllo della visibilità delle applicazioni serverless – AWS Online Tech Talks](https://www.youtube.com/watch?v=CtsiXhiAUq8)

 **Esempi correlati:** 
+ [One Observability Workshop](https://catalog.workshops.aws/observability/en-US/intro)

 **Servizi correlati:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Distro per OpenTelemetry](https://aws-otel.github.io/)

# OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro
<a name="ops_workload_health_collect_analyze_workload_metrics"></a>

Esegui regolarmente revisioni proattive delle metriche del carico di lavoro per identificare le tendenze, determinare se sia necessaria una risposta e convalidare il raggiungimento dei risultati aziendali. Aggrega le metriche delle applicazioni e dei componenti del carico di lavoro in una posizione centrale. Usa dashboard e strumenti di analisi per analizzare i dati di telemetria e determinare l'integrità del carico di lavoro. Implementa un meccanismo per lo svolgimento periodico di revisioni dell'integrità del carico di lavoro con gli stakeholder nell'organizzazione. 

 **Risultato desiderato:** 
+  Raccolta delle metriche del carico di lavoro in una posizione centrale. 
+  Uso di dashboard e strumenti di analisi per esaminare le tendenze in fatto di integrità del carico di lavoro. 
+  Svolgimento di revisioni periodiche delle metriche del carico di lavoro con l'organizzazione. 

 **Anti-pattern comuni:** 
+  L'organizzazione raccoglie metriche dal carico di lavoro in due piattaforme di osservazione diverse. Non è possibile determinare l'integrità del carico di lavoro perché le piattaforme sono incompatibili. 
+  I tassi di errore per un componente del carico di lavoro aumentano lentamente. Questa tendenza non viene rilevata perché l'organizzazione non svolge revisioni periodiche delle metriche del carico di lavoro. Il componente si guasta dopo una settimana, danneggiando il carico di lavoro. 

 **Vantaggi dell'adozione di questa best practice:** 
+  Maggiore consapevolezza riguardo all'integrità del carico di lavoro e alla realizzazione dei risultati aziendali. 
+  Possibilità di sviluppare le tendenze in fatto di integrità del carico di lavoro nel corso del tempo. 

 **Livello di rischio associato alla mancata adozione di questa best practice:** elevato 

## Guida all'implementazione
<a name="implementation-guidance"></a>

 Raccogli le metriche del carico di lavoro in una posizione centrale. Usando dashboard e strumenti di analisi, esamina le metriche del carico di lavoro per ottenere informazioni dettagliate sulla sua integrità, sviluppare tendenze in fatto di integrità e convalidare la realizzazione dei risultati aziendali. Implementa un meccanismo per lo svolgimento di revisioni periodiche delle metriche del carico di lavoro. 

 **Esempio del cliente** 

 AnyCompany Retail svolge revisioni delle metriche del carico di lavoro il mercoledì di ogni settimana. L'azienda riunisce tutti gli stakeholder ed esamina le metriche della settimana precedente. Durante la riunione, vengono evidenziate le tendenze e le informazioni dettagliate raccolte dagli strumenti di analisi. Vengono pubblicate dashboard interne con le principali metriche del carico di lavoro, che qualsiasi dipendente può visualizzare e interrogare. 

 **Passaggi dell'implementazione** 

1.  Identifica le metriche del carico di lavoro associate alla sua integrità. Partendo dai KPI aziendali, identifica le metriche per le applicazioni, i componenti e le piattaforme che forniscono una visione complessiva dell'integrità del carico di lavoro. 

   1.  Puoi pubblicare metriche personalizzate in [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html). Puoi utilizzare l'[agente Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) per raccogliere metriche e log da istanze Amazon EC2 e server on-premise. 

   1.  [AWS Distro per OpenTelemetry](https://aws-otel.github.io/) può raccogliere metriche da applicazioni esistenti e aggiungerne di nuove. 

   1.  I clienti con un piano di supporto Enterprise possono richiedere il [workshop sulla creazione di una strategia di monitoraggio](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) al proprio Technical Account Manager. Questo workshop aiuta a sviluppare una strategia di visibilità per il tuo carico di lavoro. 

1.  Raccogli le metriche del carico di lavoro in una posizione centrale. Se le metriche del carico di lavoro sono suddivise tra piattaforme diverse, può essere difficile analizzare e sviluppare le tendenze. La piattaforma deve includere dashboard e funzionalità di analisi. 

   1.  [Amazon CloudWatch](https://docs.aws.amazon.com/) può raccogliere e archiviare le metriche del carico di lavoro. In topologie con più account è consigliabile predisporre un [account di registrazione e monitoraggio centrale](https://docs.aws.amazon.com/prescriptive-guidance/latest/security-reference-architecture/log-archive.html), noto come *account archivio dei log*. 

1.  Crea una dashboard consolidata delle metriche del carico di lavoro. Usa questa visualizzazione per le revisioni delle metriche e l'analisi delle tendenze. 

   1.  Puoi creare [dashboard CloudWatch personalizzate](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) per raccogliere le metriche del carico di lavoro in una visualizzazione consolidata. 

1.  Implementa un processo di revisione delle metriche del carico di lavoro. Esamina le metriche del carico di lavoro ogni settimana, ogni due settimane o ogni mese con gli stakeholder, incluso il personale tecnico e non tecnico. Usa queste sessioni di revisione per identificare le tendenze e ottenere informazioni dettagliate sull'integrità del carico di lavoro. 

 **Livello di impegno per il piano di implementazione:** elevato Se le metriche del carico di lavoro non vengono raccolte a livello centrale, può essere necessario un investimento significativo per consolidarle in un'unica piattaforma. 

## Risorse
<a name="resources"></a>

 **Best practice correlate:** 
+  [OPS08-BP01 Identificazione degli indicatori chiave di prestazione](ops_workload_health_define_workload_kpis.md) – Devi identificare gli indicatori chiave di prestazioni prima di selezionare le metriche del carico di lavoro. 
+  [OPS08-BP02 Definizione delle metriche del carico di lavoro](ops_workload_health_design_workload_metrics.md) – Devi definire le metriche del carico di lavoro prima di raccoglierle e analizzarle. 

 **Documenti correlati:** 
+ [ Efficienza delle informazioni operative con Amazon Quick ](https://aws.amazon.com/blogs/big-data/power-operational-insights-with-amazon-quicksight/)
+ [ Uso di widget personalizzati in dashboard Amazon CloudWatch ](https://aws.amazon.com/blogs/mt/introducing-amazon-cloudwatch-dashboards-custom-widgets/)

 **Video correlati:** 
+ [ Creazione di dashboard CloudWatch tra account e regioni ](https://www.youtube.com/watch?v=eIUZdaqColg)
+ [ Monitoraggio delle risorse AWS tramite dashboard Amazon CloudWatch ](https://www.youtube.com/watch?v=I7EFLChc07M)

 **Esempi correlati:** 
+ [ Workshop sugli strumenti di gestione e governance AWS – Dashboard CloudWatch ](https://mng.workshop.aws/operations-2022/detect/cwdashboard.html)
+ [ Well-Architected Lab – Livello 100: Monitoraggio con dashboard CloudWatch ](https://www.wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/)

 **Servizi correlati:** 
+  [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+ [AWS Distro per OpenTelemetry](https://aws-otel.github.io/)

# OPS08-BP04 Definizione di valori di riferimento per le metriche del carico di lavoro
<a name="ops_workload_health_workload_metric_baselines"></a>

La definizione di valori di riferimento per le metriche del carico di lavoro semplifica la comprensione dell'integrità e delle prestazioni del carico di lavoro. Usando valori di riferimento, puoi identificare le applicazioni e i componenti che hanno prestazioni eccessive o insufficienti. La definizione di valori di riferimento per il carico di lavoro migliora la tua capacità di mitigare i problemi prima che diventino incidenti. I valori di riferimento sono alla base dello sviluppo di modelli di attività e dell'implementazione del rilevamento delle anomalie quando le metriche deviano dai valori previsti. 

 **Risultato desiderato:** 
+  Disponibilità di un livello di riferimento per le metriche del carico di lavoro in condizioni normali. 
+  Possibilità di determinare se il carico di lavoro funziona normalmente. 

 **Anti-pattern comuni:** 
+  Dopo aver implementato una nuova funzionalità, la latenza delle richieste peggiora. Non sono stati definiti valori di riferimento per una metrica composita relativa alle richieste in ingresso elaborate e alla latenza complessiva. Non è possibile determinare se la modifica abbia causato un miglioramento o un problema. 
+  Si verifica un picco improvviso nell'attività degli utenti, ma non sono stati definiti valori di riferimento per le metriche. Il picco di attività causa gradatamente una perdita di memoria in un'applicazione. Questo problema finisce per portare il carico di lavoro offline. 

 **Vantaggi dell'adozione di questa best practice:** 
+  Comprensione del modello normale di attività per il carico di lavoro usando metriche per i componenti e le applicazioni principali. 
+  Capacità di determinare se il carico di lavoro, le applicazioni e i componenti si comportano normalmente o se è necessario intervenire. 

 **Livello di rischio associato alla mancata adozione di questa best practice:** medio 

## Guida all'implementazione
<a name="implementation-guidance"></a>

 Usa dati cronologici per definire valori di riferimento per le metriche del carico di lavoro per le applicazioni e i componenti al suo interno. Utilizza valori di riferimento durante le riunioni di revisione delle metriche e per la risoluzione dei problemi. Esamina periodicamente le prestazioni del carico di lavoro e modifica i valori di riferimento in base all'evoluzione dell'architettura. 

 **Esempio del cliente** 

 In AnyCompany Retail vengono definiti valori di riferimento per tutti i componenti e le applicazioni. Usando dati cronologici, AnyCompany Retail ha sviluppato valori di riferimento per le metriche del proprio carico di lavoro in un intervallo di tempo di due mesi. Ogni due mesi l'azienda rivaluta i valori di riferimento e li modifica in base a dati reali. 

 **Passaggi dell'implementazione** 

1.  Procedendo a ritroso dalle metriche del carico di lavoro, definisci valori di riferimento per i componenti e le applicazioni principali usando dati cronologici. Limita il numero di metriche per componente o applicazione ed evita un monitoraggio eccessivo. 

   1.  Puoi usare gli [approfondimenti sulle metriche Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html) per eseguire query sulle metriche su larga scala e identificare tendenze e modelli. 

   1.  Il [rilevamento delle anomalie in Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) usa algoritmi di machine learning per identificare i modelli di comportamento per le metriche, determinare valori di riferimento e far emergere le anomalie. 

   1.  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) permette di rilevare i problemi operativi relativi al carico di lavoro usando il machine learning. 

   1.  I clienti con un piano di supporto Enterprise possono richiedere il [workshop sulla creazione di una strategia di monitoraggio](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) al proprio Technical Account Manager. Questo workshop aiuta a creare una strategia di visibilità per il carico di lavoro. 

1.  Implementa un meccanismo per esaminare periodicamente i valori di riferimento delle metriche del carico di lavoro, in particolare prima di eventi aziendali significativi. Almeno una volta a trimestre valuta i valori di riferimento per le metriche del carico di lavoro usando dati cronologici. Usa i valori di riferimento durante le riunioni di revisione delle metriche. 

 **Livello di impegno per il piano di implementazione:** basso. Dopo aver stabilito le metriche del carico di lavoro, la definizione di valori di riferimento può richiedere la raccolta di dati sufficienti per identificare i normali modelli di comportamento. 

## Risorse
<a name="resources"></a>

 **Best practice correlate:** 
+  [OPS08-BP02 Definizione delle metriche del carico di lavoro](ops_workload_health_design_workload_metrics.md) – È necessario innanzitutto definire le metriche del carico di lavoro prima di determinarne i valori di riferimento. 
+  [OPS08-BP03 Raccolta e analisi delle metriche del carico di lavoro](ops_workload_health_collect_analyze_workload_metrics.md) – È necessario organizzare la raccolta e l'analisi delle metriche del carico di lavoro prima di definire i valori di riferimento delle metriche. 
+  [OPS08-BP05 Studio dei modelli di attività previsti per il carico di lavoro](ops_workload_health_learn_workload_usage_patterns.md) – Questa best practice è basata sui valori di riferimento per lo sviluppo delle tendenze di utilizzo. 
+  [OPS08-BP06 Attivazione di un avviso quando i risultati del carico di lavoro sono a rischio](ops_workload_health_workload_outcome_alerts.md) – I valori di riferimento per le metriche sono necessari per identificare le soglie e sviluppare avvisi. 
+  [OPS08-BP07 Attivazione di un avviso quando vengono rilevate delle anomalie nel carico di lavoro](ops_workload_health_workload_anomaly_alerts.md) – Il rilevamento delle anomalie richiede la definizione di valori di riferimento per le metriche. 

 **Documenti correlati:** 
+ [ Best practice AWS per la visibilità – Allarmi ](https://aws-observability.github.io/observability-best-practices/tools/alarms/)
+ [Come monitorare le applicazioni in modo efficace](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [ Come configurare il rilevamento delle anomalie in CloudWatch per impostare allarmi dinamici, automatizzare le azioni e favorire le vendite online ](https://aws.amazon.com/blogs/mt/how-to-set-up-cloudwatch-anomaly-detection-to-set-dynamic-alarms-automate-actions-and-drive-online-sales/)
+ [ Funzionamento del rilevamento delle anomalie in CloudWatch ](https://aws.amazon.com/blogs/mt/operationalizing-cloudwatch-anomaly-detection/)

 **Video correlati:** 
+ [AWS re:Invent 2020: Monitoraggio dei servizi di produzione in Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw)
+ [AWS re:Invent 2021: Come ottenere informazioni dettagliate da metriche operative su larga scala con gli approfondimenti sulle metriche CloudWatch ](https://www.youtube.com/watch?v=xKib0xvbIfo)
+ [AWS re:Invent 2022: Sviluppo di una strategia di visibilità (COP302) ](https://www.youtube.com/watch?v=Ub3ATriFapQ)
+ [AWS Summit DC 2022: Monitoraggio e visibilità per applicazioni moderne ](https://www.youtube.com/watch?v=AHiuyT0B5Gk)
+ [AWS Summit SF 2022 - Visibilità completa e monitoraggio delle applicazioni con AWS (COP310) ](https://www.youtube.com/watch?v=or7uFFyHIX0)

 **Esempi correlati:** 
+ [ Workshop sull'integrazione di AWS CloudTrail e Amazon CloudWatch ](https://catalog.us-east-1.prod.workshops.aws/workshops/2e48b9fc-f721-4417-b811-962b7f31b61c/en-US)

 **Servizi correlati:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [ Amazon DevOps Guru ](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

# OPS08-BP05 Studio dei modelli di attività previsti per il carico di lavoro
<a name="ops_workload_health_learn_workload_usage_patterns"></a>

 Definisci modelli di attività del carico di lavoro per identificare comportamenti anomali in modo da rispondere in modo appropriato, se necessario. 

 CloudWatch, tramite la funzionalità [CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) , applica algoritmi statistici e di machine learning per generare una gamma di valori previsti che rappresentano il normale comportamento dei parametri. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) può servire per identificare comportamenti anomali tramite la correlazione di eventi, l'analisi dei registri e l'applicazione del machine learning per analizzare la telemetria del carico di lavoro. Se vengono rilevati comportamenti inattesi, fornisce i [parametri e gli eventi correlati](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) con consigli per affrontare il comportamento. 

 **Anti-pattern comuni:** 
+  Stai esaminando i log di utilizzo della rete e vedi che questo è aumentato tra le 11:30 e le 13:30 e poi di nuovo alle 16:30 alle 18:00. Non sai se questo deve essere considerato normale o meno. 
+  I server Web si riavviano ogni sera alle 03:00. Non sai se questo è un comportamento previsto. 

 **Vantaggi dell'adozione di questa best practice:** Acquisendo modelli di comportamento, puoi riconoscere comportamenti imprevisti e intervenire, se necessario. 

 **Livello di rischio associato se questa best practice non fosse adottata:** Medium 

## Guida all'implementazione
<a name="implementation-guidance"></a>
+  Studio di modelli di attività previsti per il carico di lavoro: definisci modelli di attività del carico di lavoro per stabilire quando un comportamento non rientra nei valori previsti, in modo da poter rispondere adeguatamente se necessario. 

## Risorse
<a name="resources"></a>

 **Documenti correlati:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 

# OPS08-BP06 Attivazione di un avviso quando i risultati del carico di lavoro sono a rischio
<a name="ops_workload_health_workload_outcome_alerts"></a>

 Attiva un avviso quando i risultati del carico di lavoro sono a rischio, in modo da poter rispondere adeguatamente, se necessario. 

 Idealmente, in precedenza hai identificato una soglia di parametro raggiunta la quale si deve attivare l'allarme, oppure un evento che puoi utilizzare per attivare una risposta automatizzata. 

 In AWS, è possibile utilizzare [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) per creare script canary e monitorare endpoint e API, eseguendo le stesse azioni intraprese dai clienti. Grazie alla telemetria generata e alle [informazioni ottenute](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_Details.html) identifichi i problemi prima che interessino i clienti. 

 Puoi anche utilizzare [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) per cercare e analizzare in modo interattivo i dati di log utilizzando un linguaggio di query appositamente creato. Gli approfondimenti CloudWatch Logs rilevano automaticamente [i campi nei log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData-discoverable-fields.html) dei servizi AWS e i registri eventi personalizzati in JSON. Si dimensiona in base al volume di log e alla complessità delle query e fornisce risposte in pochi secondi, aiutandoti a individuare i fattori associati all'incidente. 

 **Anti-pattern comuni:** 
+  Non disponi della connettività di rete. Nessuno lo sa. Nessuno sta cercando di identificare il motivo o intraprendere un'azione per ripristinare la connettività. 
+  Dopo una patch, le istanze persistenti non sono disponibili, creando disagi agli utenti. I tuoi utenti hanno aperto casi di supporto. Nessuno ha ricevuto notifiche. Nessuno sta intervenendo. 

 **Vantaggi dell'adozione di questa best practice:** Riconoscendo lo stato di rischio dei risultati aziendali e attivando avvisi sulla necessità di intervento, hai l'opportunità di prevenire o mitigare l'impatto di un incidente. 

 **Livello di rischio associato se questa best practice non fosse adottata:** Medium 

## Guida all'implementazione
<a name="implementation-guidance"></a>
+  Attivazione di un avviso quando i risultati del carico di lavoro sono a rischio: invia un avviso quando i risultati del carico di lavoro sono a rischio, in modo da rispondere in modo appropriato, se necessario. 
  +  [Che cos'è Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Creazione di allarmi Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Richiamo di funzioni Lambda utilizzando le notifiche di Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Risorse
<a name="resources"></a>

 **Documenti correlati:** 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Creazione di allarmi Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Richiamo di funzioni Lambda utilizzando le notifiche di Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Che cos'è Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP07 Attivazione di un avviso quando vengono rilevate delle anomalie nel carico di lavoro
<a name="ops_workload_health_workload_anomaly_alerts"></a>

 Attiva un avviso quando vengono rilevate delle anomalie nel carico di lavoro, in modo da poter rispondere adeguatamente, se necessario. 

 L'analisi dei parametri del carico di lavoro nel corso del tempo potrebbe stabilire modelli di comportamento che puoi quantificare in modo sufficiente per definire un evento o attivare un allarme in risposta. 

 Una volta addestrata, la funzionalità [CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) può essere utilizzata per inviare [allarmi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) in caso di anomalie rilevate o può fornire i valori previsti sovrapposti su un [grafico](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) di dati dei parametri per un confronto continuo. 

 **Anti-pattern comuni:** 
+  Le vendite del sito Web di vendita al dettaglio sono aumentate improvvisamente e in modo significativo. Nessuno lo sa. Nessuno sta cercando di identificare ciò che ha portato a questo picco. Nessuno interviene per garantire ai clienti un'esperienza di qualità sotto il carico aggiuntivo. 
+  Dopo l'applicazione di una patch, i tuoi server persistenti si riavviano spesso creando disagi gli utenti. In genere i server si riavviano al massimo fino a tre volte. Nessuno lo sa. Nessuno sta cercando di identificare il motivo per cui ciò si verifica. 

 **Vantaggi dell'adozione di questa best practice:** Comprendendo i modelli di comportamento del carico di lavoro, puoi identificare comportamenti imprevisti e intervenire, se necessario. 

 **Livello di rischio associato se questa best practice non fosse adottata:** Bassa 

## Guida all'implementazione
<a name="implementation-guidance"></a>
+  Attivazione di un avviso in caso di rilevamento di anomalie: invia un avviso quando vengono rilevate anomalie del carico di lavoro, in modo da rispondere in modo appropriato, se necessario. 
  +  [Che cos'è Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Creazione di allarmi Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Richiamo di funzioni Lambda utilizzando le notifiche di Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Risorse
<a name="resources"></a>

 **Documenti correlati:** 
+  [Creazione di allarmi Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [CloudWatch Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Richiamo di funzioni Lambda utilizzando le notifiche di Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Che cos'è Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP08 Convalida del raggiungimento dei risultati e dell'efficacia dei KPI e dei parametri
<a name="ops_workload_health_biz_level_view_workload"></a>

 Crea una vista a livello di business delle tue operazioni del carico di lavoro, per stabilire se le esigenze sono soddisfatte e per identificare gli aspetti da migliorare per raggiungere gli obiettivi di business. Convalida l'efficacia dei KPI e dei parametri e rivedili, se necessario. 

 AWS, inoltre, fornisce supporto per strumenti di business intelligence e sistemi per l'analisi di registri di terze parti attraverso API e SDK del servizio AWS (ad esempio Grafana, Kibana e Logstash). 

 **Anti-pattern comuni:** 
+  Il tempo di risposta della pagina non è mai stato considerato determinante per la soddisfazione dei clienti. Non hai mai stabilito un parametro o una soglia per il tempo di risposta della pagina. I tuoi clienti si lamentano della lentezza. 
+  Non hai raggiunto i tuoi obiettivi minimi in termini di tempo di risposta. Nel tentativo di migliorare il tempo di risposta, hai ampliato i server delle applicazioni. Ora stai superando gli obiettivi di tempo di risposta con un margine significativo e disponi anche di una notevole capacità inutilizzata che stai pagando. 

 **Vantaggi dell'adozione di questa best practice:** Esaminando e rivedendo i KPI e i parametri, puoi capire in che modo il carico di lavoro supporta il raggiungimento dei risultati aziendali e identificare i punti di miglioramento per ottenerli. 

 **Livello di rischio associato se questa best practice non fosse adottata:** Basso 

## Guida all'implementazione
<a name="implementation-guidance"></a>
+  Convalida del raggiungimento dei risultati e dell'efficacia dei KPI e dei parametri: crea una panoramica a livello aziendale delle operazioni dei carichi di lavoro per stabilire se le esigenze sono soddisfatte e identificare le aree migliorabili per raggiungere gli obiettivi aziendali. Convalida l'efficacia dei KPI e dei parametri e rivedili, se necessario. 
  +  [Utilizzo dei pannelli di controllo Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Che cos'è l'analisi dei log?](https://aws.amazon.com/log-analytics/) 

## Risorse
<a name="resources"></a>

 **Documenti correlati:** 
+  [Utilizzo dei pannelli di controllo Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Che cos'è l'analisi dei log?](https://aws.amazon.com/log-analytics/)