

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Appendice C ‒ Classificazione degli incidenti
<a name="appendix-c"></a>

Il monitoraggio degli incidenti all'interno di un framework di classificazione è fondamentale perché il framework fornisce una visione olistica dei tipi di guasto e dei problemi che hanno un impatto sul sistema. Se l'organizzazione tiene traccia degli incidenti solo all'interno di un'unica categoria, ad esempio i guasti dell'infrastruttura, potrebbe perdere informazioni e opportunità di miglioramento in altre aree. Monitorando gli incidenti su più classi, si ottiene una migliore comprensione della vasta gamma di esperimenti sul caos da condurre. Questa prospettiva aiuta a identificare potenziali punti ciechi e supporta l'espansione dell'ambito ingegneristico, il che porta a un sistema più resiliente e tollerante ai guasti.

Il framework di classificazione degli incidenti suggerito è progettato per aiutare a classificare gli incidenti in base alla loro natura e al potenziale impatto. Utilizza una classificazione di alto livello che raggruppa gli incidenti in otto categorie principali:
+ **Problemi di distribuzione**:
  + Implementazioni non riuscite
  + Errori di rollback
  + Problemi di configurazione durante la distribuzione
+ **Bug e regressioni del software**:
  + Bug funzionali
  + Problemi di integrazione
  + Problemi di prestazioni
  + Problemi relativi alle quote
  + Problemi relativi al meccanismo di resilienza (nuovi tentativi, timeout)
  + Problemi di integrità dei dati
+ **Problemi relativi ai test**:
  + Test mancanti
  + Test inefficaci
  + Test Flaky
+ **Guasti dell'infrastruttura**:
  + Guasti hardware (server, dispositivi di rete, storage)
  + Problemi di scalabilità
  + Errori di dipendenza (servizi di terze parti,) APIs
  + Problemi di connettività di rete
+ **Problemi operativi**:
  + Errori umani (configurazione errata, modifiche accidentali)
  + Monitoraggio e segnalazione degli errori
  + Problemi di pianificazione della capacità
  + Errori di backup e ripristino
+ **Incidenti di sicurezza**:
  + Tentativi di accesso non autorizzati
  + Violazioni dei dati
  + Attacchi Denial of Service (DoS)
+ **Interruzioni del servizio di terze parti**:
  + Interruzioni dei provider di servizi cloud
  + Guasti DNS
  + Interruzioni esterne delle API e dei servizi
+ **Fattori ambientali:**
  + Disastri naturali (terremoti, incendi, inondazioni, interruzioni di corrente)
  + Problemi legati alle condizioni meteorologiche

Questo è un esempio non conclusivo di framework di classificazione che puoi personalizzare in base alle tue esigenze e alla tua organizzazione specifiche. Consigliamo di rivedere e aggiornare periodicamente il framework di classificazione man mano che il sistema si evolve o emergono nuovi tipi di incidenti.