Pilastro dell'affidabilità - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Pilastro dell'affidabilità

Il pilastro dell'affidabilità del AWS Well-Architected Framework riguarda il modo in cui un sistema mantiene le funzionalità e i livelli di prestazioni previsti durante i periodi operativi previsti per tutta la sua durata di vita. Fornisce linee guida complete per la creazione e la manutenzione di sistemi affidabili AWS, comprese strategie per il test e la convalida in tutte le fasi del ciclo di vita del carico di lavoro.

Principali aree di interesse per l'applicazione di questo pilastro all'ambiente di streaming delle applicazioni: WorkSpaces

  • Gestione e scalabilità della flotta

  • Affidabilità della sessione

  • Disponibilità delle applicazioni

  • Procedure di ripristino

Ripristino automatico in caso di guasto

Monitora il valore aziendale KPIs per attivare risposte automatizzate in grado di prevedere, prevenire o ripristinare i guasti prima che influiscano sulle operazioni.

  • Assicurati che l'allocazione della sottorete IP tenga conto dell'espansione e della disponibilità.

  • Monitora le CloudWatch metriche critiche per garantire la disponibilità e le prestazioni del servizio, comprese le metriche sulla capacità della flotta come AvailableCapacity e e InUseCapacity le metriche sulla qualità dello streaming come. StreamingSessionLatency

  • Configura gli avvisi per le soglie di capacità, i parametri di integrità delle sessioni, il peggioramento delle prestazioni e le modifiche dello stato di salute della flotta.

  • Utilizza le funzionalità di scalabilità automatica WorkSpaces delle applicazioni integrate per:

    • Configura la capacità minima e massima della flotta.

    • Imposta politiche di scalabilità in base all'utilizzo della capacità.

    • Definisci soglie di scalabilità orizzontale e orizzontale in base alle metriche dell'esperienza utente e ai requisiti aziendali anziché solo alle metriche tecniche.

  • Crea un ambiente di disaster recovery per il tuo ambiente applicativo. WorkSpaces Per ulteriori informazioni, consulta il post AWS sul blog Considerazioni sul disaster recovery con Amazon WorkSpaces Applications.

Procedure di ripristino dei test

Gli ambienti cloud consentono il test automatizzato degli scenari di errore e delle procedure di ripristino. Queste funzionalità consentono di identificare e correggere le vulnerabilità prima che si verifichino guasti reali.

  • Test di ripristino della flotta. Implementa test completi di ripristino della flotta in più scenari:

    • Simula la terminazione dell'istanza per verificare la risposta di scalabilità automatica.

    • Convalida il mantenimento della capacità minima della flotta.

    • Verifica la tempistica di sostituzione dell'istanza e il reindirizzamento degli utenti.

    • Convalida l'efficacia delle politiche di scalabilità.

    • Verifica i limiti di capacità della flotta e la gestione dell'overflow.

  • Test di ripristino della sessione. Implementa le procedure di convalida del ripristino della sessione:

    • Prova gli scenari di disconnessione e riconnessione.

    • Verifica la conservazione dello stato dell'applicazione.

    • Prova vari scenari di interruzione della rete.

    • Convalida i comportamenti di timeout della sessione.

    • Verifica la persistenza dell'autenticazione dell'utente.

    • Verifica la gestione dell'archiviazione temporanea.

Scala orizzontalmente per aumentare la disponibilità del carico di lavoro aggregato

Distribuisci il carico di lavoro su più risorse più piccole per ridurre al minimo l'impatto dei singoli guasti ed eliminare i singoli punti di errore.

  • Distribuisci le istanze del parco istanze in più zone di disponibilità.

  • Configura la capacità minima appropriata del parco veicoli.

  • Configura la scalabilità automatica per le flotte e imposta le soglie di scalabilità appropriate.

  • Monitora l'utilizzo della capacità in tutta la flotta.

  • Distribuisci stack di WorkSpaces applicazioni in più regioni. Per ulteriori informazioni, consulta il post AWS sul blog Optimize user experience with latency-based routing for Amazon Applications. WorkSpaces

Smettila di indovinare la capacità

Utilizza le funzionalità di scalabilità automatica del cloud per adattare dinamicamente le risorse in base alla domanda. Questo aiuta a prevenire la saturazione delle risorse mantenendo al contempo un'efficienza ottimale.

  • Monitora metriche chiave come CapacityUtilization e comprendi AvailableCapacity le InUseCapacity esigenze di capacità.

  • Tieni traccia delle tendenze di utilizzo della flotta in diversi periodi di tempo. Monitora i modelli giornalieri, le variazioni settimanali, le tendenze mensili e i picchi stagionali.

  • Imposta politiche di scalabilità e configura soglie di scalabilità.

  • Assicurati che esista un divario sufficiente tra le quote correnti e l'utilizzo massimo per consentire il failover.

  • Rispetta le quote e i vincoli di servizio fissi attraverso la tua architettura.

Gestisci il cambiamento attraverso l'automazione

Implementa le modifiche all'infrastruttura tramite l'automazione, comprese le modifiche controllate dalla versione al codice di automazione stesso.

  • Usa iAC per la configurazione della flotta.

  • Implementa politiche di scalabilità coerenti.

  • Utilizzate la CLI di Image Assistant per una creazione coerente di immagini.