Cos'è la gestione degli incidenti? - Guida per l'utente avanzato di AMS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cos'è la gestione degli incidenti?

La gestione degli incidenti è il processo utilizzato da AMS per registrare, intervenire, comunicare lo stato di avanzamento e fornire la notifica degli incidenti attivi.

L'obiettivo del processo di gestione degli incidenti è garantire che il normale funzionamento del servizio gestito venga ripristinato il più rapidamente possibile, l'impatto aziendale sia ridotto al minimo e tutte le parti interessate siano tenute informate.

Alcuni esempi di incidenti includono (ma non sono limitati a) la perdita o il deterioramento della connettività di rete, un processo o un'API che non rispondono o un'attività pianificata che non viene eseguita (ad esempio, un backup fallito).

L'immagine seguente mostra il flusso di lavoro di un incidente segnalato dall'utente ad AMS.

Flusso di lavoro di gestione degli incidenti tra le operazioni AMS e il cliente in caso di incidente segnalato dal cliente.

Questo grafico mostra il flusso di lavoro di un incidente segnalato da AMS all'utente.

Flusso di lavoro di gestione degli incidenti tra AMS Operations e il cliente con un incidente CloudWatch rilevato.

Priorità dell'incidente

Gli incidenti creati nel centro di supporto AWS, nella console o nell'API Support (SAPI) hanno classificazioni diverse rispetto agli incidenti creati nella console AMS.

  • Basso: le funzioni non critiche del servizio o dell'applicazione aziendale relative alle risorse AWS o AMS ne risentono.

  • Medio: un servizio o un'applicazione aziendale relativi alle risorse AWS and/or AMS subisce un impatto moderato e funziona in uno stato degradato.

  • Alto: la tua azienda ne risente in modo significativo. Le funzioni critiche dell'applicazione relative alle risorse AWS and/or AMS non sono disponibili. Riservato alle interruzioni più critiche che interessano i sistemi di produzione.

Nota

La console AWS Support offre cinque livelli di priorità degli incidenti che traduciamo nei tre livelli AMS.

Problema vs incidente

Quando AMS ritiene che un incidente riveli un difetto o una configurazione errata più grave e possa ripresentarsi, viene considerato un problema e non un semplice incidente. In questi casi, AMS analizza il problema e offre suggerimenti per risolverlo.