Gestione degli incidenti - Guida per l'utente avanzato di AMS

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gestione degli incidenti

Gli incidenti sono problemi di Servizio AWS prestazioni che influiscono sull'ambiente gestito, come stabilito da AWS Managed Services (AMS) o da te. Gli incidenti identificati dal team AMS vengono inizialmente percepiti come «eventi»: un cambiamento nello stato del sistema rilevato dal monitoraggio. Se viene superata una soglia configurata, l'evento attiva un allarme, chiamato anche avviso. Il team operativo AMS determina se l'evento non ha alcun impatto, se si tratta di un incidente (interruzione o deterioramento del servizio) o se è un problema (la causa principale di uno o più incidenti risolti).

Il team AMS riceve anche gli incidenti identificati da te tramite il Supporto centro o in modo programmatico utilizzando l'API AWS Support con il codice del servizio. sentinel-report-incident

Una volta ricevuto dal team operativo AMS, l'incidente viene esaminato per garantire che non sia meglio classificato come richiesta di servizio. Se deve essere classificato come richiesta di servizio, viene immediatamente riclassificato e il team di richiesta di assistenza AMS prende il sopravvento e l'utente riceve una notifica. Se l'incidente può essere risolto dall'operatore ricevente, vengono prese le misure necessarie per risolverlo immediatamente. Gli operatori AMS consultano la documentazione interna per una risoluzione e, se necessario, inoltrano l'incidente ad altre risorse di supporto fino alla risoluzione dell'incidente. Per rimanere informati su ogni fase del processo di risoluzione degli incidenti, assicurati di compilare l'opzione CC Emails e, se intendi connetterti tramite federazione, accedi prima di seguire il link contenuto nell'e-mail inviata da AMS. Una volta risolto, il team operativo AMS documenta l'incidente e la risoluzione per usi futuri.

Se la risoluzione di un incidente richiede modifiche all'infrastruttura, potrebbe essere necessaria una revisione della sicurezza. Le modifiche all'infrastruttura che potrebbero richiedere una revisione della sicurezza includono quelle relative a IAM, alle politiche basate sulle risorse o all'approvazione dei rischi. Questi tipi di incidenti richiedono che un tecnico AMS Operations crei una RFC prima di apportare la modifica ed è necessaria l'approvazione di tale RFC da parte dell'utente. Ad esempio, se la risoluzione degli incidenti richiede l'aggiornamento di una policy IAM, verrà effettuata una revisione della sicurezza AMS e quindi un tecnico AMS Operations creerà una RFC con il tipo Management | Advanced stack components | Identity and Access Management (IAM) and Access Management (IAM) | Update entity o policy change (ct-27tuth19k52b4) e aspetterà l'approvazione della RFC prima di procedere.

Nota

AMS ora consente la risoluzione degli incidenti che richiedono modifiche all'infrastruttura senza la fase aggiuntiva dell'approvazione RFC. Se le modifiche necessarie per risolvere l'incidente NON richiedono una revisione di sicurezza (la modifica non è correlata a IAM, alla politica basata sulle risorse o all'approvazione del rischio), AMS può apportare le modifiche in base all'approvazione ricevuta nell'incidente, senza bisogno di un'approvazione separata in una RFC.

Per le definizioni dei termini di gestione degli incidenti, consulta i Termini chiave di AMS.

Per comprendere il percorso di crescita degli incidenti, consulta Ottenere assistenza.

Per una descrizione della risposta di AMS agli incidenti, consulta AMS Incident Response.