Ripristino automatico dell'istanza
Importante
Questa sezione descrive come configurare in modo proattivo i meccanismi di ripristino su un’istanza EC2. Tali meccanismi sono progettati per ripristinare la disponibilità dell’istanza quando AWS rileva un problema hardware o software sottostante a causa del quale un controllo dello stato del sistema ha esito negativo. Se al momento riscontri problemi di accesso all’istanza, consulta Troubleshoot EC2 instances.
Se AWS rileva che un’istanza non è disponibile a causa di un problema hardware o software sottostante, esistono due meccanismi che possono ripristinare automaticamente la disponibilità dell’istanza: il ripristino automatico semplificato e il ripristino basato su operazioni di Amazon CloudWatch. Il ripristino della disponibilità dell’istanza è noto anche come ripristino dell’istanza.
Durante il processo di ripristino dell’istanza, AWS cercherà di trasferire l’istanza dall’host che presenta il problema hardware o software sottostante a un host diverso. Se viene eseguito correttamente, il processo di ripristino dell’istanza verrà visualizzato dall’istanza come riavvio non programmato. Puoi verificare se è avvenuto un ripristino dell’istanza.
In caso di esito negativo del processo di ripristino, l’istanza potrebbe continuare a essere eseguita sull’host che presenta il problema hardware o software sottostante. In tal caso, è richiesto un intervento manuale. Se l’istanza diventa irraggiungibile o se il controllo dello stato del sistema continua ad avere esito negativo, ti consigliamo di arrestare e avviare manualmente l’istanza. Al momento dell’avvio dell’istanza, viene solitamente effettuata la migrazione a un nuovo computer host sottostante. Tuttavia, a differenza del ripristino automatico dell’istanza, in cui quest’ultima mantiene il proprio indirizzo IPv4 pubblico, un’istanza riavviata riceve un nuovo indirizzo IPv4 pubblico a meno che non disponga di un indirizzo IP elastico.
Per usufruire dei meccanismi di ripristino automatico, devi configurarli su un’istanza in anticipo, prima che un controllo dello stato del sistema abbia esito negativo. Per impostazione predefinita, il ripristino automatico semplificato è abilitato durante l’avvio dell’istanza. Puoi configurare il ripristino basato su operazioni di Amazon CloudWatch facoltativamente dopo l’avvio. La configurazione di uno di questi meccanismi rende l’istanza più resiliente.
Il ripristino automatico semplificato e il ripristino basato su operazioni di Amazon CloudWatch sono disponibili solo sulle istanze supportate. Per ulteriori informazioni, consulta Requisiti per l’abilitazione del ripristino automatico semplificato e Requisiti per l’abilitazione del ripristino basato su operazioni di CloudWatch.
avvertimento
Quando AWS ripristina un’istanza a causa di un problema hardware o software sottostante, tieni in considerazione le seguenti conseguenze: i dati archiviati nella memoria volatile (RAM) andranno persi e il tempo di attività del sistema operativo ripartirà da zero. Inoltre, con il recupero basato su operazioni di CloudWatch, anche i dati presenti nei volumi di archivio dell’istanza andranno persi. Per proteggere i dati importanti, consigliamo di creare regolarmente dei backup. Per ulteriori informazioni sulle best practice di backup e ripristino per le istanze EC2, consulta Best practices for Amazon EC2.
I meccanismi di recupero dell’istanza sono progettati per singole istanze. Per indicazioni su come creare un sistema resiliente, consulta Creare un sistema resiliente.
Argomenti
Concetti chiave del ripristino automatico dell’istanza
Il ripristino automatico dell’istanza è una funzionalità di Amazon EC2 che ripristina automaticamente la disponibilità di un’istanza quando si verificano guasti hardware o software sottostanti, migliorando la resilienza e l’affidabilità delle istanze EC2.
Di seguito sono riportati alcuni concetti chiave del ripristino automatico dell’istanza:
- Opzioni di configurazione
-
Puoi configurare due meccanismi per supportare il ripristino automatico dell’istanza:
-
Ripristino automatico semplificato: abilitato per impostazione predefinita sulle istanze supportate.
-
Ripristino basato su operazioni di CloudWatch: richiede la configurazione manuale sulle istanze supportate.
-
- Verifiche dello stato del sistema
-
I controlli dello stato del sistema monitorano automaticamente l’infrastruttura AWS su cui viene eseguita l’istanza EC2.
-
Se un controllo dello stato del sistema ha esito negativo, AWS avvia il ripristino automatico dell’istanza, che tenta di eseguire la migrazione dell’istanza interessata su un hardware diverso.
-
Un controllo dello stato del sistema che ha esito negativo indica un problema hardware o software dell’host, non un problema dell’istanza stessa. Il ripristino automatico può ripristinare un’istanza con un controllo dello stato del sistema con esito negativo. Tuttavia, il ripristino automatico non viene eseguito se il solo controllo dello stato dell’istanza ha esito negativo.
-
Per informazioni sulle differenze tra i controlli dello stato dell’istanza e del sistema, consulta Types of status checks.
-
- Esempi di problemi hardware o software sottostanti
-
I problemi hardware o software che possono causare controlli dello stato del sistema con esito negativo includono la perdita di connettività di rete, la perdita di alimentazione del sistema e problemi di software e hardware sull’host fisico che compromettono la possibilità di raggiungere la rete.
- Caratteristiche delle istanze ripristinate
-
Un’istanza ripristinata è identica all’istanza originale, a eccezione degli elementi persi.
Elementi mantenuti:
-
ID istanza
-
Indirizzi IP pubblici, privati ed elastici
-
Metadati delle istanze
-
Gruppo di posizionamento
-
Volumi EBS collegati
-
Zona di disponibilità
Elementi persi:
-
Dati archiviati nella memoria volatile (RAM)
-
Dati archiviati nei volumi di archivio dell’istanza (applicabile solo al ripristino basato su operazioni di CloudWatch)
-
Il tempo di attività del sistema operativo si azzera
-
- Monitoraggio dei controlli dello stato del sistema con CloudWatch
-
La metrica StatusCheckFailed_System di CloudWatch indica se un controllo dello stato del sistema ha avuto esito positivo o negativo.
Valore della metrica:
-
0: il controllo dello stato del sistema ha avuto esito positivo.
-
1: il controllo dello stato del sistema ha avuto esito negativo.
-
- Eventi in AWS Health Dashboard
-
Durante i tentativi di ripristino automatico dell’istanza, AWS invia eventi alla AWS Health Dashboard in base al meccanismo di recupero configurato e al relativo risultato:
-
Ripristino automatico semplificato
-
Evento con esito positivo:
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS -
Evento con esito negativo:
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
-
-
Ripristino basato su operazioni di CloudWatch
-
Evento con esito positivo:
AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS -
Evento con esito negativo:
AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE
-
-
Differenze tra il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch
La seguente tabella confronta le differenze principali tra il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch.
| Punto di confronto | Ripristino automatico semplificato | Ripristino basato su operazioni di CloudWatch |
|---|---|---|
| Configurazione | Abilitato per impostazione predefinita sulle istanze supportate | Richiede la configurazione manuale di allarmi e operazioni CloudWatch |
| Flessibilità | Comportamento di ripristino fisso gestito da AWS | Operazioni e condizioni personalizzabili |
| Notification | Notifiche base tramite AWS Health Dashboard | Notifiche personalizzabili tramite SNS |
| Dimensione istanze metal | Esclusa | Incluso |
| Volumi di archivio dell’istanza collegati all’avvio | Non supportato per le istanze che collegano volumi di archivio dell’istanza all’avvio | Supportato su tipi di istanze selezionati. Tieni presente che tutti i dati presenti sui volumi di archivio dell’istanza vengono persi durante il recupero dell’istanza. |
| Tempo di ripristino | Tentativo di ripristino standard | Tentativi di ripristino più veloci rispetto al ripristino automatico semplificato |
| Risoluzione del problema dell’host durante la migrazione | La migrazione potrebbe essere annullata e l’istanza rimane sull’host originale | La migrazione continua verso un nuovo host |
| Costo | Nessun costo aggiuntivo | Potrebbero essere applicati costi CloudWatch |
Creare un sistema resiliente
Anche se il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch sono efficaci per mantenere la disponibilità delle singole istanze, AWS consiglia di implementare un’architettura a elevata disponibilità che consenta il failover del traffico su istanze integre.
Per raggiungere questo risultato, valuta di utilizzare servizi AWS come Elastic Load Balancing (che distribuisce il traffico in entrata su più istanze EC2) e Amazon EC2 Auto Scaling (che regola automaticamente il numero di istanze in base alla domanda e all’integrità).
Per ulteriori informazioni sulla creazione di un sistema resiliente e con tolleranza ai guasti basato su istanze EC2, consulta le seguenti risorse:
-
Back to Basics: Designing for Failure with EC2
sul canale YouTube di AWS -
Disaster Recovery (DR) Architecture on AWS, Part I: Strategies for Recovery in the Cloud
sul sito AWS Architecture Blog -
REL11-BP02 Fail over to healthy resources nel Pilastro di affidabilità del Framework AWS Well-Architected