PERF02-BP05 Utilizzo dell'elasticità disponibile delle risorse
Il cloud offre la flessibilità necessaria per espandere o ridurre le risorse in modo dinamico attraverso una serie di meccanismi per soddisfare i cambiamenti della domanda. Se combinato con parametri relativi all'elaborazione, un carico di lavoro può rispondere automaticamente a questi cambiamenti e utilizzare la gamma di risorse più opportuna per raggiungere il suo obiettivo.
La corrispondenza ottimale tra risorse fornite e domanda determina il costo più basso per il sistema. Tuttavia, sarà anche necessario tenere conto del tempo di provisioning e di eventuali errori delle singole risorse e pianificare risorse sufficienti di conseguenza. La domanda può essere fissa o variabile e richiede parametri e automazione, per garantire che la gestione non diventi troppo complicata e onerosa dal punto di vista economico.
Con AWS puoi adottare varie strategie per associare l'offerta alla domanda. Il whitepaper sul principio dell'ottimizzazione dei costi descrive come utilizzare i seguenti approcci ai costi:
-
Approccio basato sulla domanda
-
Approccio basato sui buffer
-
Approccio basato sul tempo
Assicurati che le distribuzioni dei carichi di lavoro siano in grado di gestire eventi di dimensionamento. Crea scenari di test per eventi di ridimensionamento per garantire che il carico di lavoro si comporti come previsto.
Anti-pattern comuni:
-
Reagisci agli allarmi e aumenti manualmente la capacità.
-
Dopo un evento di dimensionamento, lasci una capacità aumentata anziché ridurre il dimensionamento.
Vantaggi dell'adozione di questa best practice: Configurare e testare l'elasticità del carico di lavoro è utile per risparmiare denaro, mantenere i benchmark prestazionali e migliorare l'affidabilità al variare del traffico. La maggior parte delle istanze non di produzione deve essere arrestata quando le istanze non vengono utilizzate. Anche se è possibile arrestare manualmente le istanze inutilizzate, questa operazione è impraticabile su più grandi scale. Puoi inoltre sfruttare l'elasticità basata sul volume, che ti consente di ottimizzare le prestazioni e i costi aumentando automaticamente il numero di istanze di calcolo durante i picchi di domanda e riducendo la capacità quando la domanda diminuisce.
Livello di rischio associato se questa best practice non fosse adottata: Medio
Guida all'implementazione
Utilizzo ottimale dell'elasticità: l'elasticità corrisponde all'offerta di risorse disponibili rispetto alla relativa domanda. Istanze, container e funzioni forniscono tutti meccanismi di elasticità, in combinazione con il ridimensionamento automatico o sotto forma di funzionalità del servizio. Utilizza l'elasticità all'interno della tua architettura per assicurarti di disporre della capacità sufficiente per rispettare i requisiti di prestazione a tutti i livelli di utilizzo. Verifica che i parametri per il dimensionamento delle risorse elastiche siano convalidati rispetto al tipo di carico di lavoro distribuito. Se distribuisci un'applicazione di transcodifica video, è previsto il 100% di utilizzo della CPU e non deve essere il parametro principale. In alternativa, puoi misurare la profondità della coda dei processi di transcodifica in attesa di dimensionare i tipi di istanze. Assicurati che le distribuzioni dei carichi di lavoro siano in grado di gestire eventi di dimensionamento. Ridimensionare in modo sicuro i componenti del carico di lavoro è fondamentale quanto ricalibrare le risorse quando richiesto dalla domanda. Crea scenari di test per eventi di ridimensionamento per garantire che il carico di lavoro si comporti come previsto.
Risorse
Documenti correlati:
Video correlati:
Esempi correlati: