Verifiche dello stato delle istanze Amazon EC2 - Amazon Elastic Compute Cloud

Verifiche dello stato delle istanze Amazon EC2

Grazie al monitoraggio dello stato delle istanze, puoi determinare rapidamente se Amazon EC2 ha rilevato problemi che potrebbero impedire alle istanze di eseguire le applicazioni. Amazon EC2 esegue i controlli automatici su ogni istanza EC2 in esecuzione per individuare i problemi di hardware e software. Puoi visualizzare i risultati delle verifiche dello stato per individuare problemi specifici e rilevabili. I dato sullo stato degli eventi vanno ad aumentare le informazioni già fornite da Amazon EC2 sullo stato di ogni istanza (come pending, running, stopping) e sui parametri di utilizzo monitorati da Amazon CloudWatch (utilizzo di CPU, traffico di rete e attività del disco).

Le verifiche dello stato vengono eseguite ogni minuto e restituiscono un risultato positivo o negativo. Se vengono superate tutte le verifiche, lo stato complessivo dell'istanza sarà OK. Se invece una o più verifiche non vengono superate, lo stato complessivo sarà impaired (danneggiata). Le verifiche dello stato sono integrate in Amazon EC2 in modo tale da non poter essere disattivate o eliminate.

Quando una verifica dello stato non riesce, viene incrementato il parametro CloudWatch corrispondente per le verifiche dello stato. Per ulteriori informazioni, consulta Parametri di controllo dello stato. Puoi utilizzare questi parametri per creare allarmi CloudWatch che vengono attivati in base al risultato delle verifiche dello stato. Ad esempio, puoi creare un allarme che ti avvisi se il risultato delle verifiche dello stato di una specifica istanza è negativo. Per ulteriori informazioni, consulta Creare allarmi CloudWatch per le istanze Amazon EC2 che non superano le verifiche di stato.

È inoltre possibile creare un allarme di Amazon CloudWatch che controlli un'istanza Amazon EC2 e la ripristini automaticamente se dovesse danneggiarsi a causa di un problema sottostante. Per ulteriori informazioni, consulta Ripristino automatico dell'istanza.

Tipi di verifica dello stato

Esistono tre tipi di controlli dello stato.

Verifiche dello stato del sistema

I controlli dello stato del sistema monitorano i sistemi AWS su cui viene eseguita l'istanza. Tali verifiche rilevano i problemi sottostanti della tua istanza per la cui risoluzione è richiesto l'intervento di AWS. Quando una verifica dello stato del sistema ha esito negativo, puoi scegliere se attendere che AWS risolva il problema o se risolverlo direttamente. Puoi arrestare e avviare manualmente le istanze supportate da Amazon EBS, operazione che nella maggior parte dei casi comporta la migrazione dell'istanza a un nuovo host. Per le istanze sostenute dall’archivio dell’istanza (supportate soltanto per le istanze Linux), puoi terminare e sostituire l’istanza. Si noti che i volumi dell'instance store sono effimeri e tutti i dati vengono persi quando l'istanza viene arrestata.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento delle verifiche dello stato del sistema:

  • Perdita di connettività di rete

  • Perdita di alimentazione elettrica del sistema

  • Problemi di software sull'host fisico

  • Problemi hardware sull'host fisico che incidono sulla raggiungibilità della rete

Se un controllo dello stato del sistema fallisce, incrementiamo il parametro StatusCheckFailed_System.

Istanze Bare Metal

Se esegui un riavvio dal sistema operativo su un'istanza bare metal, il controllo dello stato del sistema potrebbe restituire temporaneamente uno stato di errore. Quando l'istanza diventa disponibile, il controllo dello stato del sistema deve restituire uno stato di riuscita.

Verifiche dello stato delle istanze

Verifiche dello stato delle istanze monitorano la connettività del software e della rete della singola istanza. Amazon EC2 verifica lo stato di integrità dell'istanza inviando una richiesta ARP (Address Resolution Protocol) all'interfaccia di rete (NIC). Tali verifiche rilevano i problemi per la cui risoluzione è richiesto il tuo intervento. Se l'esito della verifica dello stato di un'istanza è negativo, solitamente devi risolvere direttamente il problema (ad esempio riavviando l'istanza o modificandone la configurazione).

Nota

Le distribuzioni Linux recenti che utilizzano systemd-networkd per la configurazione di rete potrebbero creare report sui controlli dell'integrità in modo diverso rispetto alle distribuzioni precedenti. Durante il processo di avvio, questo tipo di rete può iniziare prima e potenzialmente concludere prima di altre attività di avvio, e ciò può influire anche sullo stato dell'istanza. Le verifiche dello stato che dipendono dalla disponibilità di rete possono creare report sullo stato di integrità prima del completamento di altre attività.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento delle verifiche dello stato delle istanze:

  • Verifiche dello stato del sistema non riuscite

  • Configurazione errata di rete o startup

  • Memoria esaurita

  • File system danneggiato

  • Kernel non compatibile

  • Durante un riavvio, una verifica dello stato delle istanze segnala un errore finché l’istanza non diventa nuovamente disponibile.

Se un controllo dello stato dell'istanza fallisce, incrementiamo il parametro StatusCheckFailed_Instance.

Istanze Bare Metal

Se esegui un riavvio dal sistema operativo su un'istanza bare metal, il controllo dello stato dell'istanza potrebbe restituire temporaneamente uno stato di errore. Quando l'istanza diventa disponibile, il controllo dello stato dell'istanza deve restituire uno stato di riuscita.

Controlli dello stato dei volumi EBS collegati

I controlli dello stato dei volumi EBS collegati verificano se i volumi Amazon EBS collegati a un'istanza sono raggiungibili e in grado di completare operazioni di I/O. Il parametro StatusCheckFailed_AttachedEBS è un valore binario che segnala un deterioramento nel caso in cui uno o più volumi EBS collegati all'istanza non siano in grado di completare le operazioni di I/O. Questi controlli dello stato rilevano problemi di fondo con l'infrastruttura di calcolo o Amazon EBS. Quando il parametro di controllo dello stato del volume EBS collegato ha esito negativo, è possibile attendere la risoluzione del problema da parte di AWS oppure intraprendere varie operazioni, come sostituire i volumi interessati o arrestare e riavviare l'istanza.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento dei controlli dello stato dei volumi EBS collegati:

  • Problemi hardware o software sui sottosistemi di archiviazione alla base dei volumi EBS

  • Problemi hardware sull'host fisico che incidono sulla raggiungibilità dei volumi EBS

  • Problemi di connettività tra l'istanza e i volumi EBS

È possibile utilizzare il parametro StatusCheckFailed_AttachedEBS per migliorare la resilienza di un carico di lavoro. È possibile utilizzare questi parametri per creare allarmi Amazon CloudWatch che vengono attivati in base al risultato dei controlli dello stato. Ad esempio, è possibile eseguire il failover su una zona di disponibilità o su un'istanza secondaria quando si rileva un impatto prolungato. In alternativa, è possibile monitorare le prestazioni di I/O di ciascun volume collegato utilizzando i parametri di EBS CloudWatch per rilevare e sostituire il volume danneggiato. Se il carico di lavoro non determina I/O su nessuno dei volumi EBS collegati all’istanza e il controllo dello stato del volume EBS collegato indica un problema, puoi arrestare e avviare l’istanza per trasferirla a un nuovo host. In questo modo puoi risolvere i problemi sottostanti all’host che influiscono sulla raggiungibilità dei volumi EBS. Per ulteriori informazioni, consulta Parametri Amazon CloudWatch per Amazon EBS.

È anche possibile configurare i gruppi di Amazon EC2 Auto Scaling per rilevare gli errori di verifiche dello stato dei volumi EBS collegati e quindi sostituire l'istanza interessata con una nuova. Per ulteriori informazioni, consulta Monitorare e sostituire le istanze di Auto Scaling con volumi Amazon EBS danneggiati nella Guida per l'utente di Amazon EC2 Auto Scaling.

Nota

Il parametro di controllo dello stato dei volumi EBS collegati è disponibile solo per le istanze Nitro.