Principi di progettazione

Ecco i principi di progettazione per l'eccellenza operativa nel cloud:

Esegui le operazioni come codice: nel cloud puoi applicare la medesima disciplina di progettazione che utilizzi per il codice dell'applicazione a tutto il tuo ambiente. Puoi definire l'intero carico di lavoro (applicazioni, infrastruttura ecc.) come codice e aggiornarlo con il codice. Puoi creare script per le procedure operative e automatizzarne i processi lanciandoli in risposta a eventi. Con l'esecuzione delle operazioni come codice limiti gli errori umani e crei risposte coerenti agli eventi.
Apporta modifiche frequenti, piccole e reversibili: progetta carichi di lavoro scalabili e con accoppiamento debole per consentire l'aggiornamento regolare dei componenti. Le tecniche di implementazione automatizzate insieme a modifiche incrementali più piccole riducono il raggio di esplosione, ovvero l'entità dell'impatto, e consentono un'inversione più rapida in caso di guasti. Ciò aumenta la fiducia necessaria per apportare modifiche strategiche al carico di lavoro mantenendo la qualità e adattandosi rapidamente ai cambiamenti delle condizioni di mercato.
Perfeziona frequentemente le procedure operative: man mano che potenzi i carichi di lavoro, perfeziona le operazioni in modo appropriato. Se usi procedure operative, cerca delle opportunità per migliorarle. Organizza regolari revisioni per accertarti che tutte le procedure siano efficaci e che i team le conoscano adeguatamente. Se vengono individuate delle lacune, aggiorna le procedure di conseguenza. Comunica gli aggiornamenti procedurali a tutte le parti interessate e ai team. Converti le operazioni in gioco per condividere le best practice e fornire occasioni di formazione ai team.
Prevedi gli insuccessi: esegui un'analisi “pre-mortem” per individuare le potenziali cause di errore in modo da eliminarle o ridurle. Testa gli scenari di errore e convalida la tua comprensione relativamente al loro impatto. Testa le procedure di risposta per assicurarti che siano efficaci e che i team ne conoscano il processo. Organizza regolarmente game day per testare i carichi di lavoro e le risposte dei team agli eventi simulati.
Impara da tutti gli insuccessi operativi: favorisci il miglioramento tramite le lezioni apprese da tutti gli eventi e gli errori operativi. Condividi ciò che hai imparato con i vari team e con tutta l'organizzazione.
Usa servizi gestiti: riduci il carico operativo utilizzando servizi gestiti da AWS, laddove possibile. Sviluppa procedure operative basate sulle interazioni con tali servizi.
Implementa l'osservabilità per ottenere informazioni utili: acquisisci informazioni dettagliate su comportamento, prestazioni, affidabilità, costi e stato del carico di lavoro. Stabilisci indicatori chiave delle prestazioni (KPI) e usa la telemetria dell'osservabilità per prendere decisioni informate e agire tempestivamente quando i risultati aziendali sono a rischio. Migliora in modo proattivo le prestazioni, l'affidabilità e i costi sulla base di dati osservabili utilizzabili.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Eccellenza operativa

Definizione