Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa modelli storici per scalare i servizi Amazon ECS con scalabilità predittiva
Il dimensionamento predittivo analizza i dati di caricamento passati provenienti dai flussi di traffico per analizzare i modelli giornalieri o settimanali. Poi utilizza l'analisi per anticipare le esigenze future e aumentare in modo proattivo le attività del tuo servizio secondo necessità.
Il dimensionamento automatico predittivo è particolarmente utile nelle seguenti situazioni:
-
Traffico ciclico: un uso elevato di risorse durante i normali orari di ufficio e un utilizzo ridotto di risorse durante la notte e il weekend.
-
Modelli di on-and-off carico di lavoro ricorrenti ‐ Gli esempi includono l'elaborazione in batch, i test o l'analisi periodica dei dati.
-
Applicazioni con tempi di inizializzazione lunghi: possono influire sulle prestazioni delle applicazioni durante gli eventi di aumento orizzontale, causando una notevole latenza.
Se le applicazioni richiedono molto tempo per l'inizializzazione e il traffico aumenta con uno schema regolare, è consigliabile utilizzare il dimensionamento predittivo. Aiuta a scalare più velocemente aumentando in modo proattivo il numero di attività per i carichi previsti, anziché utilizzare solo politiche di dimensionamento dinamico, come Target Tracking o Step Scaling. Aiutando a evitare la possibilità di effettuare un provisioning eccessivo del numero di attività, il dimensionamento predittivo può anche consentire di risparmiare denaro.
Ad esempio, consideriamo un'applicazione che ha un utilizzo elevato durante l'orario di lavoro e uno ridotto durante la notte. All'inizio di ogni giornata lavorativa, il dimensionamento predittivo può aumentare orizzontalmente le attività prima del primo afflusso di traffico. Ciò permette all'applicazione di mantenere elevata disponibilità e prestazioni quando si passa da un periodo di utilizzo inferiore a un periodo di utilizzo più elevato. Non è necessario attendere che il dimensionamento dinamico reagisca alla variazione di traffico. Inoltre, non è necessario dedicare tempo alla verifica dei modelli di carico dell'applicazione e al tentativo di pianificare la giusta quantità di attività con il dimensionamento programmato.
La scalabilità predittiva è una funzionalità a livello di servizio che ridimensiona l'attività del servizio indipendentemente dalla scalabilità della capacità di elaborazione sottostante (ad esempio, o Fargate). EC2 Per Fargate, AWS gestisce e ridimensiona automaticamente la capacità sottostante in base ai requisiti delle attività. Per quanto riguarda la EC2 capacità, puoi utilizzare i provider di capacità di gruppo Amazon EC2 Auto Scaling per ridimensionare automaticamente EC2 le istanze sottostanti in base ai requisiti di scalabilità delle tue attività.
Indice
Funzionamento del dimensionamento predittivo in Amazon ECS
Qui si possono scoprire le considerazioni sull'utilizzo del dimensionamento predittivo, come funziona e quali sono i limiti.
Considerazioni sull'utilizzo del dimensionamento predittivo
-
Il dimensionamento predittivo deve essere adeguato al carico di lavoro. Si può verificare configurando le policy di dimensionamento in modalità solo previsione e vedere cosa consiglia la console. È necessario valutare la previsione e i consigli prima di iniziare a utilizzare il dimensionamento predittivo.
-
Prima che il dimensionamento predittivo possa avviare la previsione, servono almeno 24 ore di dati cronologici. Maggiore è il numero di dati cronologici disponibili, più efficace è la previsione, con un periodo ideale di due settimane. Si dovrà inoltre attendere 24 ore prima che il dimensionamento predittivo possa generare nuove previsioni quando si elimina un servizio Amazon ECS e se ne crea uno nuovo. Un modo per velocizzare questa operazione è utilizzare parametri personalizzati per aggregare i parametri tra il vecchio e il nuovo servizio Amazon ECS.
-
Scegliere una metrica di carico che rappresenta con precisione il carico completo dell'applicazione ed è l'aspetto dell'applicazione su cui è più importante basare il dimensionamento.
-
Il dimensionamento dinamico con dimensionamento predittivo consente di seguire da vicino la richiesta della propria applicazione, in modo ridurre le attività durante le pause e aumentarle durante gli aumenti imprevisti del traffico. Quando sono attive più policy di dimensionamento, ciascuna di esse determina il numero desiderato di attività in modo indipendente, che viene impostato al massimo.
-
È possibile utilizzare il dimensionamento predittivo insieme alle policy di dimensionamento dinamico, come il monitoraggio della destinazione o il dimensionamento graduale, in modo che le applicazioni si scalino in base a modelli storici e in tempo reale. Di per sé, il dimensionamento predittivo non consente di ridurre orizzontalmente le attività.
-
Se si utilizza un ruolo personalizzato durante la chiamata all'
register-scalable-targetAPI, si potrebbe ricevere un errore che indica che la policy di dimensionamento predittivo può funzionare solo con SLR abilitata. In questo caso, è necessario chiamare di nuovoregister-scalable-targetma senza role-arn. Usare SLR per registrare la destinazione scalabile e chiamare l'APIput-scaling-policy.
Funzionamento del dimensionamento predittivo
Puoi utilizzare la scalabilità predittiva creando una politica di scalabilità predittiva che specifica la metrica da monitorare e analizzare. CloudWatch Per avviare valori futuri di previsione, il dimensionamento predittivo richiede almeno 24 ore di dati.
Dopo aver creato la policy, il dimensionamento predittivo inizia ad analizzare i dati metrici relativi agli ultimi 14 giorni per identificare i modelli. Questa analisi viene utilizzata per generare previsioni orarie dei requisiti per le prossime 48 ore. I CloudWatch dati più recenti vengono utilizzati per aggiornare la previsione ogni sei ore. Con l'arrivo di nuovi dati, il dimensionamento predittivo migliora continuamente l'accuratezza delle previsioni future.
La prima volta che si abilita il dimensionamento predittivo, questo viene eseguito in modalità di sola previsione. Genera previsioni in questa modalità, ma non dimensiona il servizio Amazon ECS in base a tali previsioni. Ciò significa che è possibile valutare l'accuratezza e l'idoneità della previsione. È possibile visualizzare i dati di previsione utilizzando l'operazione API GetPredictiveScalingForecast o la Console di gestione AWS.
Quando si decide di iniziare a utilizzare il dimensionamento predittivo, si deve passare dalla policy di dimensionamento alla modalità di previsione e scalabilità. In questa modalità si verifica quanto segue.
Per impostazione predefinita, il servizio Amazon ECS viene ridimensionato all'inizio di ogni ora in base alla previsione per quell'ora. È possibile scegliere di iniziare prima utilizzando la proprietà SchedulingBufferTime nell'operazione API PutScalingPolicy. Ciò consente l'avvio di nuove attività prima della domanda della previsione e si dispone del tempo per l'avvio e la preparazione a gestire il traffico.
Limite massimo di attività
Quando si registrano i servizi Amazon ECS per il dimensionamento, si definisce un numero massimo di attività che possono essere avviate per ogni servizio. Per impostazione predefinita, quando vengono impostate le policy di dimensionamento, non possono aumentare il numero di attività oltre il limite massimo.
In alternativa, è possibile consentire l'aumento automatico del numero massimo di attività del servizio se la previsione si avvicina o supera il numero massimo di attività del servizio Amazon ECS.
avvertimento
Fare attenzione quando si consente l'aumento automatico del numero massimo di attività. Ciò può comportare l'avvio di più attività del previsto, se l'aumento del numero massimo di attività non viene monitorato e gestito. L'aumento del numero massimo di attività diventa quindi il nuovo normale numero massimo per il servizio Amazon ECS fino a quando non viene aggiornato manualmente. Il numero massimo di attività non torna automaticamente al massimo originale.
Regioni supportate
-
Stati Uniti orientali (Virginia settentrionale)
-
Stati Uniti orientali (Ohio)
-
Stati Uniti occidentali (California settentrionale)
-
Stati Uniti occidentali (Oregon)
-
Africa (Città del Capo)
-
Asia Pacifico (Hong Kong)
-
Asia Pacifico (Giacarta)
-
Asia Pacifico (Mumbai)
-
Asia Pacific (Osaka)
-
Asia Pacific (Seul)
-
Asia Pacifico (Singapore)
-
Asia Pacifico (Sydney)
-
Asia Pacifico (Tokyo)
-
Canada (Centrale)
-
Cina (Pechino)
-
China (Ningxia)
-
Europa (Francoforte)
-
Europa (Irlanda)
-
Europa (Londra)
-
Europa (Milano)
-
Europa (Parigi)
-
Europa (Stoccolma)
-
Medio Oriente (Bahrein)
-
Sud America (San Paolo)
-
AWS GovCloud (Stati Uniti orientali)
-
AWS GovCloud (Stati Uniti occidentali)