Ripristino automatico dell'istanza - Amazon Elastic Compute Cloud

Ripristino automatico dell'istanza

Importante

Questa sezione descrive come configurare in modo proattivo i meccanismi di ripristino su un’istanza EC2. Tali meccanismi sono progettati per ripristinare la disponibilità dell’istanza quando AWS rileva un problema hardware o software sottostante a causa del quale un controllo dello stato del sistema ha esito negativo. Se al momento riscontri problemi di accesso all’istanza, consulta Troubleshoot EC2 instances.

Se AWS rileva che un’istanza non è disponibile a causa di un problema hardware o software sottostante, esistono due meccanismi che possono ripristinare automaticamente la disponibilità dell’istanza: il ripristino automatico semplificato e il ripristino basato su operazioni di Amazon CloudWatch. Il ripristino della disponibilità dell’istanza è noto anche come ripristino dell’istanza.

Durante il processo di ripristino dell’istanza, AWS cercherà di trasferire l’istanza dall’host che presenta il problema hardware o software sottostante a un host diverso. Se viene eseguito correttamente, il processo di ripristino dell’istanza verrà visualizzato dall’istanza come riavvio non programmato. Puoi verificare se è avvenuto un ripristino dell’istanza.

In caso di esito negativo del processo di ripristino, l’istanza potrebbe continuare a essere eseguita sull’host che presenta il problema hardware o software sottostante. In tal caso, è richiesto un intervento manuale. Se l’istanza diventa irraggiungibile o se il controllo dello stato del sistema continua ad avere esito negativo, ti consigliamo di arrestare e avviare manualmente l’istanza. Al momento dell’avvio dell’istanza, viene solitamente effettuata la migrazione a un nuovo computer host sottostante. Tuttavia, a differenza del ripristino automatico dell’istanza, in cui quest’ultima mantiene il proprio indirizzo IPv4 pubblico, un’istanza riavviata riceve un nuovo indirizzo IPv4 pubblico a meno che non disponga di un indirizzo IP elastico.

Per usufruire dei meccanismi di ripristino automatico, devi configurarli su un’istanza in anticipo, prima che un controllo dello stato del sistema abbia esito negativo. Per impostazione predefinita, il ripristino automatico semplificato è abilitato durante l’avvio dell’istanza. Puoi configurare il ripristino basato su operazioni di Amazon CloudWatch facoltativamente dopo l’avvio. La configurazione di uno di questi meccanismi rende l’istanza più resiliente.

Il ripristino automatico semplificato e il ripristino basato su operazioni di Amazon CloudWatch sono disponibili solo sulle istanze supportate. Per ulteriori informazioni, consulta Requisiti per l’abilitazione del ripristino automatico semplificato e Requisiti per l’abilitazione del ripristino basato su operazioni di CloudWatch.

avvertimento

Quando AWS ripristina un’istanza a causa di un problema hardware o software sottostante, tieni in considerazione le seguenti conseguenze: i dati archiviati nella memoria volatile (RAM) andranno persi e il tempo di attività del sistema operativo ripartirà da zero. Inoltre, con il recupero basato su operazioni di CloudWatch, anche i dati presenti nei volumi di archivio dell’istanza andranno persi. Per proteggere i dati importanti, consigliamo di creare regolarmente dei backup. Per ulteriori informazioni sulle best practice di backup e ripristino per le istanze EC2, consulta Best practices for Amazon EC2.

I meccanismi di recupero dell’istanza sono progettati per singole istanze. Per indicazioni su come creare un sistema resiliente, consulta Creare un sistema resiliente.

Concetti chiave del ripristino automatico dell’istanza

Il ripristino automatico dell’istanza è una funzionalità di Amazon EC2 che ripristina automaticamente la disponibilità di un’istanza quando si verificano guasti hardware o software sottostanti, migliorando la resilienza e l’affidabilità delle istanze EC2.

Di seguito sono riportati alcuni concetti chiave del ripristino automatico dell’istanza:

Opzioni di configurazione

Puoi configurare due meccanismi per supportare il ripristino automatico dell’istanza:

Verifiche dello stato del sistema

I controlli dello stato del sistema monitorano automaticamente l’infrastruttura AWS su cui viene eseguita l’istanza EC2.

  • Se un controllo dello stato del sistema ha esito negativo, AWS avvia il ripristino automatico dell’istanza, che tenta di eseguire la migrazione dell’istanza interessata su un hardware diverso.

  • Un controllo dello stato del sistema che ha esito negativo indica un problema hardware o software dell’host, non un problema dell’istanza stessa. Il ripristino automatico può ripristinare un’istanza con un controllo dello stato del sistema con esito negativo. Tuttavia, il ripristino automatico non viene eseguito se il solo controllo dello stato dell’istanza ha esito negativo.

  • Per informazioni sulle differenze tra i controlli dello stato dell’istanza e del sistema, consulta Types of status checks.

Esempi di problemi hardware o software sottostanti

I problemi hardware o software che possono causare controlli dello stato del sistema con esito negativo includono la perdita di connettività di rete, la perdita di alimentazione del sistema e problemi di software e hardware sull’host fisico che compromettono la possibilità di raggiungere la rete.

Caratteristiche delle istanze ripristinate

Un’istanza ripristinata è identica all’istanza originale, a eccezione degli elementi persi.

Elementi mantenuti:

  • ID istanza

  • Indirizzi IP pubblici, privati ed elastici

  • Metadati delle istanze

  • Gruppo di posizionamento

  • Volumi EBS collegati

  • Zona di disponibilità

Elementi persi:

  • Dati archiviati nella memoria volatile (RAM)

  • Dati archiviati nei volumi di archivio dell’istanza (applicabile solo al ripristino basato su operazioni di CloudWatch)

  • Il tempo di attività del sistema operativo si azzera

Monitoraggio dei controlli dello stato del sistema con CloudWatch

La metrica StatusCheckFailed_System di CloudWatch indica se un controllo dello stato del sistema ha avuto esito positivo o negativo.

Valore della metrica:

  • 0: il controllo dello stato del sistema ha avuto esito positivo.

  • 1: il controllo dello stato del sistema ha avuto esito negativo.

Eventi in AWS Health Dashboard

Durante i tentativi di ripristino automatico dell’istanza, AWS invia eventi alla AWS Health Dashboard in base al meccanismo di recupero configurato e al relativo risultato:

  • Ripristino automatico semplificato

    • Evento con esito positivo: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS

    • Evento con esito negativo: AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE

  • Ripristino basato su operazioni di CloudWatch

    • Evento con esito positivo: AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS

    • Evento con esito negativo: AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE

Differenze tra il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch

La seguente tabella confronta le differenze principali tra il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch.

Punto di confronto Ripristino automatico semplificato Ripristino basato su operazioni di CloudWatch
Configurazione Abilitato per impostazione predefinita sulle istanze supportate Richiede la configurazione manuale di allarmi e operazioni CloudWatch
Flessibilità Comportamento di ripristino fisso gestito da AWS Operazioni e condizioni personalizzabili
Notification Notifiche base tramite AWS Health Dashboard Notifiche personalizzabili tramite SNS
Dimensione istanze metal Esclusa Incluso
Volumi di archivio dell’istanza collegati all’avvio Non supportato per le istanze che collegano volumi di archivio dell’istanza all’avvio Supportato su tipi di istanze selezionati. Tieni presente che tutti i dati presenti sui volumi di archivio dell’istanza vengono persi durante il recupero dell’istanza.
Tempo di ripristino Tentativo di ripristino standard Tentativi di ripristino più veloci rispetto al ripristino automatico semplificato
Risoluzione del problema dell’host durante la migrazione La migrazione potrebbe essere annullata e l’istanza rimane sull’host originale La migrazione continua verso un nuovo host
Costo Nessun costo aggiuntivo Potrebbero essere applicati costi CloudWatch

Creare un sistema resiliente

Anche se il ripristino automatico semplificato e il ripristino basato su operazioni di CloudWatch sono efficaci per mantenere la disponibilità delle singole istanze, AWS consiglia di implementare un’architettura a elevata disponibilità che consenta il failover del traffico su istanze integre.

Per raggiungere questo risultato, valuta di utilizzare servizi AWS come Elastic Load Balancing (che distribuisce il traffico in entrata su più istanze EC2) e Amazon EC2 Auto Scaling (che regola automaticamente il numero di istanze in base alla domanda e all’integrità).

Per ulteriori informazioni sulla creazione di un sistema resiliente e con tolleranza ai guasti basato su istanze EC2, consulta le seguenti risorse: