

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Modelli avanzati di resilienza Multi-AZ
<a name="advanced-multi-az-resilience-patterns"></a>

Data di pubblicazione:**11 luglio 2023**([Revisioni del documento](document-revisions.md))

Molti clienti eseguono i propri carichi di lavoro in configurazioni di Multi-Availability Zone (AZ) ad alta disponibilità. Queste architetture funzionano bene durante gli eventi di errore binario, ma spesso incontrano problemi con*grigio*fallimenti. Le manifestazioni di questo tipo di guasto possono essere sottili e sfuggire a un rilevamento rapido e definitivo. Questo documento fornisce indicazioni su come strumentare i carichi di lavoro per rilevare l'impatto dei guasti grigi isolati in una singola zona di disponibilità e quindi adottare misure per mitigare tale impatto nella zona di disponibilità.

## Introduzione
<a name="introduction"></a>

 Lo scopo di questo documento è aiutarti a implementare in modo più efficace architetture Multi-AZ resilienti. Una delle migliori pratiche per la creazione di sistemi resilienti in[Cloud privato virtuale Amazon](https://aws.amazon.com/vpc/)Le reti (VPC) sono[distribuisci ogni carico di lavoro su più zone di disponibilità](https://docs.aws.amazon.com/vpc/latest/userguide/vpc-security-best-practices.html). 

 Un[Zona di disponibilità](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)è uno o più data center discreti con alimentazione, rete e connettività ridondanti. L'utilizzo di più zone di disponibilità consente di gestire carichi di lavoro più altamente disponibili, tolleranti agli errori e scalabili di quanto sarebbe possibile da un singolo data center. 

 MoltiAWSservizi, come[Scalabilità automatica di Amazon Elastic Compute Cloud (EC2)](https://aws.amazon.com/ec2/autoscaling/)o[Servizio di database relazionale Amazon](https://aws.amazon.com/rds/)(Amazon RDS), fornisce una configurazione Multi-AZ. Questi servizi non richiedono la creazione di strumenti aggiuntivi di osservabilità o failover. Rendono i carichi di lavoro resilienti a modalità di errore binarie facilmente rilevabili all'interno di un[Regione AWS](https://aws.amazon.com/about-aws/global-infrastructure/regions_az/)che riguardano una singola zona di disponibilità. Potrebbe trattarsi di un completo guasto fisico dell'hardware, di un'interruzione dell'alimentazione o di un bug software latente che interessa la maggior parte delle risorse. 

 Ma esiste un'altra categoria di fallimenti denominata*guasti grigi*, le cui manifestazioni sono sottili e sfuggono a un'individuazione rapida e definitiva. Ciò a sua volta comporta tempi più lunghi per mitigare l'impatto causato dal guasto. Questo documento si concentra sugli impatti che i guasti grigi possono avere sulle architetture Multi-AZ, su come rilevarli e, infine, su come mitigarli. 

****  
Le linee guida fornite in questo white paper sono applicabili principalmente a classi specifiche di carichi di lavoro che:  
Usa principalmente zonaleAWSservizi
Necessità di migliorare la resilienza delle singole regioni
Sono disposti a fare un investimento significativo per costruire i modelli di osservabilità e resilienza richiesti
In questi carichi di lavoro, potresti non essere disposto a fare alcuni o tutti i compromessi presentati in[Risposta ai guasti grigi](gray-failures.md#responding-to-gray-failures)o non avere la possibilità di utilizzare più regioni. È probabile che questi tipi di carichi di lavoro rappresentino un piccolo sottoinsieme del portafoglio complessivo e pertanto questa guida dovrebbe essere considerata a livello di carico di lavoro anziché a livello di piattaforma. 