Scalabilità graduale delle dimensioni del provider di capacità Periodo di preparazione dell'istanza Capacità di riserva

Accelerazione del provisioning della capacità dei cluster Amazon ECS con i fornitori di capacità su Amazon EC2

I clienti che utilizzano Amazon ECS su Amazon EC2 possono sfruttare Amazon ECS Cluster Auto Scaling (CAS) per gestire la scalabilità dei gruppi Amazon Auto EC2 Scaling (ASG). Con il CAS puoi configurare Amazon ECS per scalare automaticamente il tuo ASG e concentrarti solo sull'esecuzione delle tue attività. Amazon ECS garantirà la scalabilità interna e orizzontale dell'ASG in base alle necessità senza ulteriori interventi. I provider di capacità Amazon ECS vengono utilizzati per gestire l'infrastruttura nel cluster, garantendo che vi siano istanze di container sufficienti a soddisfare le esigenze dell'applicazione. Per maggiori informazioni su come funziona il CAS di Amazon ECS, consulta Approfondimento sul dimensionamento automatico dei cluster Amazon ECS.

Poiché CAS si basa su un'integrazione CloudWatch basata su ASG per regolare la capacità del cluster, ha una latenza intrinseca associata alla pubblicazione delle CloudWatch metriche, al tempo impiegato dalla metrica per CapacityProviderReservation violare gli CloudWatch allarmi (sia alto che basso) e al tempo impiegato da un'istanza Amazon appena lanciata per il riscaldamento. EC2 Puoi adottare le seguenti misure per rendere il CAS più reattivo per implementazioni più rapide:

Scalabilità graduale delle dimensioni del provider di capacità

I fornitori di capacità di Amazon ECS alla fine troveranno grow/shrink le istanze di container più adatte a soddisfare le esigenze della tua applicazione. Il numero minimo di istanze che Amazon ECS avvierà è impostato su 1 per impostazione predefinita. Ciò potrebbe comportare un aumento dei tempi di implementazione, qualora fossero necessarie diverse istanze per l'esecuzione delle attività in sospeso. Puoi aumentare la minimumScalingStepSize utilizzando l'API Amazon ECS per aumentare il numero minimo di istanze scalabili da Amazon ECS per volta. Un valore maximumScalingStepSize troppo basso può limitare il numero di istanze di container scalate in entrata o in uscita alla volta, rallentando le implementazioni.

Nota

Questa configurazione è attualmente disponibile solo utilizzando o. CreateCapacityProviderUpdateCapacityProvider APIs

Periodo di preparazione dell'istanza

Il periodo di riscaldamento dell'istanza è il periodo di tempo dopo il quale un' EC2 istanza Amazon appena lanciata può contribuire ai CloudWatch parametri per il gruppo Auto Scaling. Alla fine del periodo di riscaldamento specificato, l'istanza viene conteggiata ai fini delle metriche aggregate dell'ASG e il CAS procede con la successiva iterazione di calcoli per stimare il numero di istanze richieste.

Il valore predefinito per instanceWarmupPeriodè 300 secondi, che puoi configurare su un valore inferiore utilizzando CreateCapacityProvidero UpdateCapacityProvider APIs per un ridimensionamento più reattivo.

Capacità di riserva

Se il tuo provider di capacità non dispone di istanze di container per l'inserimento delle attività, deve aumentare (scalare) la capacità del cluster avviando EC2 immediatamente le istanze Amazon e attendere che si avviino prima di poter avviare contenitori su di esse. Questo può ridurre significativamente la velocità di avvio delle attività. Sono quindi disponibili due opzioni.

In questo caso, disporre di EC2 capacità Amazon di riserva già avviata e pronta per l'esecuzione delle attività aumenterà la percentuale effettiva di avvio delle attività. Puoi usare la configurazione Target Capacity per indicare che vuoi mantenere una capacità di riserva nei cluster. Ad esempio, impostando Target Capacity all'80%, indichi che il cluster necessita di una capacità di riserva del 20% in ogni momento. Questa capacità di riserva consente di avviare immediatamente qualsiasi attività autonoma, garantendo che l'avvio delle attività non sia limitato. Il compromesso, nel caso di questo approccio, è il potenziale aumento dei costi legati al mantenimento della capacità di riserva del cluster.

Un approccio alternativo che si può prendere in considerazione è quello di aggiungere margine di manovra al tuo servizio, e non al provider di capacità. Ciò significa che invece di ridurre la configurazione della Target Capacity per avviare la capacità di riserva, puoi aumentare il numero di repliche nel servizio modificando la metrica di dimensionamento di monitoraggio delle destinazioni o le soglie di dimensionamento graduale del dimensionamento automatico. Tieni presente che questo approccio sarà utile solo per i carichi di lavoro soggetti a picchi, ma non avrà alcun effetto quando si implementano nuovi servizi e si passa da 0 a N attività per la prima volta. Per ulteriori informazioni sui criteri di dimensionamento correlati, consulta le Policy di dimensionamento di monitoraggio delle destinazioni o le Policy di dimensionamento per fasi

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Scelta delle dimensioni delle attività Fargate

Accedi alle funzionalità con le impostazioni dell'account