

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# AWS Resilience Hub concetti
<a name="concepts-terms"></a>

Questi concetti possono aiutarvi a comprendere meglio l' AWS Resilience Hub approccio adottato per migliorare la resilienza delle applicazioni e prevenire le interruzioni delle applicazioni.

## Resilienza
<a name="resiliency"></a>

La capacità di mantenere la disponibilità e di riprendersi da interruzioni del software e dell'operatività in un determinato periodo di tempo. 

## Obiettivo del punto di ripristino (RPO)
<a name="RPO"></a>

Il periodo di tempo massimo accettabile dall'ultimo punto di ripristino dei dati. Questo determina ciò che si considera una perdita di dati accettabile tra l’ultimo punto di ripristino e l’interruzione del servizio.

## Obiettivo del tempo di ripristino (RTO)
<a name="RTO"></a>

Il ritardo massimo accettabile tra l'interruzione del servizio e il ripristino del servizio. Questo determina ciò che viene considerato un intervallo di tempo accettabile in caso di indisponibilità del servizio.

## Obiettivo stimato del tempo di ripristino del carico di lavoro
<a name="est-workload-RTO"></a>

L'obiettivo del tempo di ripristino del carico di lavoro stimato (RTO stimato del carico di lavoro) è l'RTO che l'applicazione dovrebbe soddisfare in base alla definizione dell'applicazione importata e quindi eseguire una valutazione.

## Obiettivo stimato del punto di ripristino del carico di lavoro
<a name="est-workload-RPO"></a>

L'obiettivo stimato del punto di ripristino del carico di lavoro (RPO stimato del carico di lavoro) è l'RPO stimato che l'applicazione dovrebbe soddisfare in base alla definizione dell'applicazione importata, quindi esegui una valutazione.

## Applicazione
<a name="application"></a>

Un' AWS Resilience Hub applicazione è una raccolta di risorse AWS supportate che vengono continuamente monitorate e valutate per gestirne il livello di resilienza.

## Componente dell'applicazione
<a name="app-component"></a>

Un gruppo di AWS risorse correlate che funzionano e falliscono come unità singola. Ad esempio, se avete un database primario e uno di replica, entrambi i database appartengono allo stesso componente applicativo (AppComponent).

AWS Resilience Hub determina quali AWS risorse possono appartenere a quale tipo di AppComponent. Ad esempio, a `DBInstance` può appartenere `AWS::ResilienceHub::DatabaseAppComponent` ma non a`AWS::ResilienceHub::ComputeAppComponent`.

## Stato di conformità dell'applicazione
<a name="app-compliance"></a>

AWS Resilience Hub riporta i seguenti tipi di stato di conformità per le applicazioni.

**Politica soddisfatta** 

Si stima che l'applicazione soddisfi gli obiettivi RTO e RPO definiti nella politica. Tutti i suoi componenti soddisfano gli obiettivi politici definiti. Ad esempio, hai selezionato un obiettivo RTO e RPO di 24 ore per le interruzioni tra AWS le regioni. AWS Resilience Hub puoi vedere che i tuoi backup vengono copiati nella tua regione di riserva. È comunque necessario mantenere un ripristino da una procedura operativa standard (SOP) di backup e testarlo e cronometrarlo. Questo è incluso nelle raccomandazioni operative e fa parte del punteggio di resilienza complessivo.

**Politica violata**

Non è stato possibile stimare che l'applicazione soddisfi gli obiettivi RTO e RPO definiti nella politica. Uno o più di essi AppComponents non soddisfano gli obiettivi politici. Ad esempio, è stato selezionato un obiettivo RTO e RPO di 24 ore per le interruzioni tra le AWS regioni, ma la configurazione del database non include alcun metodo di ripristino interregionale, come la replica globale e le copie di backup.

**Non valutato**

La domanda richiede una valutazione. Al momento non è valutata o tracciata.

**Modifiche rilevate**

Esiste una nuova versione pubblicata dell'applicazione che non è stata ancora valutata.

## Rilevamento delle deviazioni
<a name="drift-status"></a>

AWS Resilience Hub esegue una notifica di drift mentre esegue una valutazione dell'applicazione per verificare se le modifiche alle AppComponent configurazioni hanno influito sullo stato di conformità dell'applicazione. Inoltre, controlla e rileva anche modifiche come l'aggiunta o l'eliminazione di risorse all'interno delle fonti di input dell'applicazione e invia notifiche in merito. A scopo di confronto, AWS Resilience Hub utilizza la valutazione precedente in cui il componente dell'applicazione soddisfaceva la politica. AWS Resilience Hub rileva i seguenti tipi di derive:
+ **Deviazione delle politiche applicative**: questo tipo di deriva identifica tutte quelle AppComponents che erano conformi alla policy nella valutazione precedente ma che non erano conformi nella valutazione corrente.
+ **Deriva delle risorse dell'applicazione**: questo tipo di deriva identifica tutte le risorse alla deriva nella versione corrente dell'applicazione.

## Valutazione della resilienza
<a name="Resiliency-assessment"></a>

AWS Resilience Hub utilizza un elenco di lacune e potenziali rimedi per misurare l'efficacia di una politica selezionata per riprendersi e continuare dopo un disastro. Valuta ogni componente dell'applicazione o lo stato di conformità dell'applicazione alla policy. Questo rapporto include raccomandazioni per l'ottimizzazione dei costi e riferimenti a potenziali problemi.

## Punteggio di resilienza
<a name="Resiliency-score"></a>

AWS Resilience Hub genera un punteggio che indica in che misura l'applicazione segue i nostri consigli per soddisfare la politica di resilienza, gli allarmi, le procedure operative standard (SOPs) e i test dell'applicazione.

## Tipo di interruzione
<a name="disruption"></a>

AWS Resilience Hub ti aiuta a valutare la resilienza rispetto ai seguenti tipi di interruzioni:

**Applicazione**

L'infrastruttura è integra, ma lo stack di applicazioni o software non funziona come necessario. Ciò può verificarsi dopo l'implementazione di nuovo codice, le modifiche alla configurazione, il danneggiamento dei dati o il malfunzionamento delle dipendenze a valle. 

**Infrastruttura cloud**

L'infrastruttura cloud non funziona come previsto a causa di un'interruzione. Un'interruzione può verificarsi a causa di un errore locale in uno o più componenti. Nella maggior parte dei casi, questo tipo di interruzione viene risolto riavviando, riciclando o ricaricando i componenti difettosi.

**Interruzione dell'infrastruttura Cloud AZ**

Una o più zone di disponibilità non sono disponibili. Questo tipo di interruzione può essere risolto passando a una zona di disponibilità diversa.

**Incidente relativo alla regione dell'infrastruttura cloud**

Una o più regioni non sono disponibili. Questo tipo di incidente può essere risolto passando a un altro Regione AWS.

## AWS FIS esperimenti
<a name="fault-injection-experiments"></a>

AWS Resilience Hub consiglia di sperimentare utilizzando AWS FIS azioni per verificare la resilienza delle applicazioni rispetto a diversi tipi di interruzioni. Queste interruzioni includono applicazioni, infrastrutture, zone di disponibilità (AZ) o Regione AWS incidenti relativi ai componenti dell'applicazione.

Questi esperimenti consentono di effettuare le seguenti operazioni:
+ Iniettare un errore.
+ Verifica che gli allarmi siano in grado di rilevare un'interruzione.
+ Verificate che le procedure di ripristino, o le procedure operative standard (SOPs), funzionino correttamente per ripristinare l'applicazione dall'interruzione. 

Test per SOPs misurare l'RTO stimato del carico di lavoro e l'RPO stimato del carico di lavoro. È possibile testare diverse configurazioni dell'applicazione e misurare se l'RTO e l'RPO di output soddisfano gli obiettivi definiti nella politica. 

## FERMARE
<a name="SOP"></a>

Una procedura operativa standard (SOP) è una serie di passaggi prescrittivi progettati per ripristinare in modo efficiente l'applicazione in caso di interruzione o allarme. In base alla valutazione dell'applicazione, ne AWS Resilience Hub consiglia una serie SOPs e si consiglia di prepararli, testarli e SOPs misurarli prima di un'interruzione per garantire un ripristino tempestivo.