Concetti chiave del ripristino automatico dell’istanza Differenze tra ripristino automatico semplificato e ripristino basato sull' CloudWatchazione Creare un sistema resiliente

Ripristino automatico dell’istanza

Importante

Questa sezione descrive come configurare in modo proattivo i meccanismi di ripristino su un’istanza EC2. Tali meccanismi sono progettati per ripristinare la disponibilità dell’istanza quando AWS rileva un problema hardware o software sottostante a causa del quale un controllo dello stato del sistema ha esito negativo. Se al momento riscontri problemi di accesso all’istanza, consulta Troubleshoot EC2 instances.

Se AWS rileva che un'istanza non è disponibile a causa di un problema hardware o software sottostante, esistono due meccanismi che possono ripristinare automaticamente la disponibilità dell'istanza: il ripristino automatico semplificato e il ripristino basato sulle CloudWatch azioni di Amazon. Il ripristino della disponibilità dell’istanza è noto anche come ripristino dell’istanza.

Durante il processo di ripristino dell'istanza, AWS tenterà di spostare l'istanza dall'host con il problema hardware o software sottostante a un altro host. Se viene eseguito correttamente, il processo di ripristino dell’istanza verrà visualizzato dall’istanza come riavvio non programmato. Puoi verificare se è avvenuto un ripristino dell’istanza.

In caso di esito negativo del processo di ripristino, l’istanza potrebbe continuare a essere eseguita sull’host che presenta il problema hardware o software sottostante. In tal caso, è richiesto un intervento manuale. Se l’istanza diventa irraggiungibile o se il controllo dello stato del sistema continua ad avere esito negativo, ti consigliamo di arrestare e avviare manualmente l’istanza. Al momento dell’avvio dell’istanza, viene solitamente effettuata la migrazione a un nuovo computer host sottostante. Tuttavia, a differenza del ripristino automatico dell'istanza, in cui l'istanza mantiene il proprio IPv4 indirizzo pubblico, un'istanza riavviata riceve un nuovo IPv4 indirizzo pubblico a meno che non disponga di un indirizzo IP elastico.

Per usufruire dei meccanismi di ripristino automatico, devi configurarli su un’istanza in anticipo, prima che un controllo dello stato del sistema abbia esito negativo. Per impostazione predefinita, il ripristino automatico semplificato è abilitato durante l’avvio dell’istanza. Opzionalmente, puoi configurare Amazon CloudWatch Action Based Recovery dopo il lancio. La configurazione di uno di questi meccanismi rende l’istanza più resiliente.

Il ripristino automatico semplificato e il ripristino basato su CloudWatch azioni di Amazon sono disponibili solo nelle istanze supportate. Per ulteriori informazioni, consultare Requisiti per l’abilitazione del ripristino automatico semplificato e Requisiti per abilitare il ripristino basato sulle CloudWatch azioni.

avvertimento

Quando AWS ripristini l'istanza a causa di un problema hardware o software sottostante, tieni presente le seguenti conseguenze: i dati archiviati nella memoria volatile (RAM) andranno persi e l'operatività del sistema operativo ricomincerà da zero. Inoltre, con il ripristino basato sull' CloudWatch azione, andranno persi anche i dati sui volumi di archiviazione delle istanze. Per proteggere i dati importanti, consigliamo di creare regolarmente dei backup. Per ulteriori informazioni sulle best practice di backup e ripristino per le istanze EC2, consulta Best practices for Amazon EC2.

I meccanismi di recupero dell’istanza sono progettati per singole istanze. Per indicazioni su come creare un sistema resiliente, consulta Creare un sistema resiliente.

Argomenti

Concetti chiave del ripristino automatico dell’istanza

Il ripristino automatico dell’istanza è una funzionalità di Amazon EC2 che ripristina automaticamente la disponibilità di un’istanza quando si verificano guasti hardware o software sottostanti, migliorando la resilienza e l’affidabilità delle istanze EC2.

Di seguito sono riportati alcuni concetti chiave del ripristino automatico dell’istanza:

Opzioni di configurazione

Puoi configurare due meccanismi per supportare il ripristino automatico dell’istanza:

Ripristino automatico semplificato: abilitato per impostazione predefinita sulle istanze supportate.
CloudWatch ripristino basato sull'azione: richiede la configurazione manuale sulle istanze supportate.

Verifiche dello stato del sistema

I controlli dello stato del sistema monitorano automaticamente l' AWS infrastruttura su cui viene eseguita l'istanza EC2.

Se un controllo dello stato del sistema fallisce, AWS avvia il ripristino automatico dell'istanza, che tenta di migrare l'istanza interessata su hardware diverso.
Un controllo dello stato del sistema che ha esito negativo indica un problema hardware o software dell’host, non un problema dell’istanza stessa. Il ripristino automatico può ripristinare un’istanza con un controllo dello stato del sistema con esito negativo. Tuttavia, il ripristino automatico non viene eseguito se il solo controllo dello stato dell’istanza ha esito negativo.
Per informazioni sulle differenze tra i controlli dello stato dell’istanza e del sistema, consulta Types of status checks.

Esempi di problemi hardware o software sottostanti

I problemi hardware o software che possono causare controlli dello stato del sistema con esito negativo includono la perdita di connettività di rete, la perdita di alimentazione del sistema e problemi di software e hardware sull’host fisico che compromettono la possibilità di raggiungere la rete.

Caratteristiche delle istanze ripristinate

Un’istanza ripristinata è identica all’istanza originale, a eccezione degli elementi persi.

Elementi mantenuti:

ID istanza
Indirizzi IP pubblici, privati ed elastici
Metadati delle istanze
Gruppo di posizionamento
Volumi EBS collegati
Zona di disponibilità

Elementi persi:

Dati archiviati nella memoria volatile (RAM)
Dati archiviati nei volumi di archiviazione delle istanze (applicabile solo al ripristino basato sulle CloudWatch azioni)
Il tempo di attività del sistema operativo si azzera

Monitoraggio dei controlli dello stato del sistema con CloudWatch

La metrica StatusCheckFailed_System in CloudWatch indica se un controllo dello stato del sistema ha avuto esito positivo o negativo.

Valore della metrica:

0: il controllo dello stato del sistema ha avuto esito positivo.
1: il controllo dello stato del sistema ha avuto esito negativo.

Eventi in Health Dashboard

Durante i tentativi di ripristino automatico delle istanze, AWS invia gli eventi all'utente in Health Dashboard base al meccanismo di ripristino configurato e al relativo risultato:

Ripristino automatico semplificato
- Evento con esito positivo: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
- Evento con esito negativo: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
CloudWatch ripristino basato sull'azione
- Evento con esito positivo: AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS
- Evento con esito negativo: AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

Differenze tra ripristino automatico semplificato e ripristino basato sull' CloudWatchazione

La tabella seguente confronta le principali differenze tra il ripristino automatico semplificato e il ripristino basato sull' CloudWatch azione.

Punto di confronto	Ripristino automatico semplificato	CloudWatch ripristino basato sull'azione
Configurazione	Abilitato per impostazione predefinita sulle istanze supportate	Richiede la configurazione manuale di CloudWatch allarmi e azioni
Flessibilità	Comportamento di ripristino fisso gestito da AWS	Operazioni e condizioni personalizzabili
Notification	Notifiche di base tramite Health Dashboard	Notifiche personalizzabili tramite SNS
Dimensione istanze metal	Esclusa	Incluso
Volumi di archivio dell’istanza collegati all’avvio	Non supportato per le istanze che collegano volumi di archivio dell’istanza all’avvio	Supportato su tipi di istanze selezionati. Tieni presente che tutti i dati presenti sui volumi di archivio dell’istanza vengono persi durante il recupero dell’istanza.
Tempo di ripristino	Tentativo di ripristino standard	Tentativi di ripristino più veloci rispetto al ripristino automatico semplificato
Risoluzione del problema dell’host durante la migrazione	La migrazione potrebbe essere annullata e l’istanza rimane sull’host originale	La migrazione continua verso un nuovo host
Costo	Nessun costo aggiuntivo	Potrebbero incorrere in CloudWatch addebiti

Creare un sistema resiliente

Sebbene il ripristino automatico semplificato e il ripristino basato sulle CloudWatch azioni siano efficaci per mantenere la disponibilità delle singole istanze, AWS consiglia di implementare un'architettura ad alta disponibilità che consenta il failover del traffico verso istanze integre.

Per raggiungere questo obiettivo, prendi in considerazione l'utilizzo di AWS servizi come Elastic Load Balancing (che distribuisce il traffico in entrata su più istanze EC2) e Amazon EC2 Auto Scaling (che regola automaticamente il numero di istanze in base alla domanda e allo stato).

Per ulteriori informazioni sulla creazione di un sistema resiliente e con tolleranza ai guasti basato su istanze EC2, consulta le seguenti risorse:

Ritorno alle basi: progettazione per il fallimento con EC2 sul canale AWS YouTube
Disaster Recovery (DR) Architecture on AWS, parte I: Strategie per il ripristino nel cloud sul sito del blog AWS Architecture
Application Load Balancers User Guide
Guida per l'utente di Amazon EC2 Auto Scaling
REL11- BP02 Failover su risorse sane nel Reliability Pillar AWS Well-Architected Framework

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Ritiro

Verificare se è avvenuto il ripristino automatico