Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa modelli storici per scalare i servizi Amazon ECS con scalabilità predittiva
La scalabilità predittiva analizza i dati di caricamento passati provenienti dai flussi di traffico per analizzare i modelli giornalieri o settimanali. Utilizza quindi questa analisi per anticipare le esigenze future e aumentare in modo proattivo le attività del servizio in base alle esigenze.
La scalabilità automatica predittiva è particolarmente utile nelle seguenti situazioni.
-
Traffico ciclico ‐ Maggiore utilizzo delle risorse durante il normale orario lavorativo e riduzione dell'utilizzo delle risorse durante la sera e nei fine settimana.
-
Schemi di on-and-off carico di lavoro ricorrenti ‐ Gli esempi includono l'elaborazione in batch, i test o l'analisi periodica dei dati.
-
Applicazioni con tempi di inizializzazione lunghi ‐ Ciò può influire sulle prestazioni delle applicazioni durante gli eventi di scalabilità orizzontale causando una latenza notevole.
Se l'inizializzazione delle applicazioni impiega molto tempo e il traffico aumenta regolarmente, è consigliabile prendere in considerazione l'utilizzo del ridimensionamento predittivo. Ti aiuta a scalare più velocemente aumentando in modo proattivo il numero di attività per i carichi previsti, anziché utilizzare solo politiche di scalabilità dinamiche, come Target Tracking o Step Scaling. Aiutandovi a evitare la possibilità di sovraccaricare il numero di attività, la scalabilità predittiva può anche potenzialmente farvi risparmiare denaro.
Ad esempio, consideriamo un'applicazione che ha un utilizzo elevato durante l'orario di lavoro e uno ridotto durante la notte. All'inizio di ogni giornata lavorativa, la scalabilità predittiva consente di ridimensionare le attività prima del primo afflusso di traffico. Ciò permette all'applicazione di mantenere elevata disponibilità e prestazioni quando si passa da un periodo di utilizzo inferiore a un periodo di utilizzo più elevato. Non è necessario attendere che il dimensionamento dinamico reagisca alla variazione di traffico. Inoltre, non è necessario perdere tempo a esaminare i modelli di caricamento dell'applicazione e a cercare di pianificare la giusta quantità di attività utilizzando la scalabilità pianificata.
La scalabilità predittiva è una funzionalità a livello di servizio che ridimensiona l'attività del servizio indipendentemente dalla scalabilità della capacità di elaborazione sottostante (ad esempio, o Fargate). EC2 Per Fargate, AWS gestisce e ridimensiona automaticamente la capacità sottostante in base ai requisiti delle attività. Per quanto riguarda la EC2 capacità, puoi utilizzare i provider di capacità di gruppo Auto Scaling per ridimensionare automaticamente EC2 le istanze sottostanti in base ai requisiti di scalabilità delle tue attività.
Indice
Come funziona la scalabilità predittiva in Amazon ECS
Qui puoi scoprire le considerazioni sull'utilizzo della scalabilità predittiva, come funziona e quali sono i limiti.
Considerazioni sull'utilizzo della scalabilità predittiva
-
Vuoi assicurarti che la scalabilità predittiva sia adatta al tuo carico di lavoro. Puoi verificarlo configurando le politiche di scalabilità in modalità solo previsione e vedere cosa consiglia la console. È necessario valutare la previsione e i consigli prima di iniziare a utilizzare la scalabilità predittiva.
-
Prima che la scalabilità predittiva possa iniziare a fare previsioni, sono necessarie almeno 24 ore di dati storici. Maggiore è il numero di dati storici disponibili, più efficace è la previsione, ideale per due settimane. Dovrai inoltre attendere 24 ore prima che la scalabilità predittiva possa generare nuove previsioni quando elimini un servizio Amazon ECS e ne crei uno nuovo. Un modo per velocizzare questa operazione consiste nell'utilizzare parametri personalizzati per aggregare i parametri tra il vecchio e il nuovo servizio Amazon ECS.
-
Scegli una metrica di carico che rappresenti accuratamente il carico completo della tua applicazione e sia l'aspetto dell'applicazione su cui è più importante scalare.
-
La scalabilità dinamica con scalabilità predittiva ti aiuta a seguire da vicino la domanda della tua applicazione, in modo da poterla scalare in avanti durante le pause e in orizzontale durante gli aumenti imprevisti del traffico. Quando sono attive più politiche di scalabilità, ciascuna politica determina il numero desiderato di attività in modo indipendente e il numero di attività desiderato è impostato sul massimo di tali attività.
-
È possibile utilizzare la scalabilità predittiva insieme alle politiche di scalabilità dinamica, come il monitoraggio degli obiettivi o la scalabilità dei passaggi, in modo che le applicazioni si scalino in base a modelli storici e in tempo reale. Di per sé, la scalabilità predittiva non consente la scalabilità delle attività.
-
Se utilizzi un ruolo personalizzato quando chiami l'
register-scalable-target
API, potresti ricevere un errore che indica che la politica di scalabilità predittiva può funzionare solo con SLR abilitata. In questo caso dovresti chiamare diregister-scalable-target
nuovo ma senza role-arn. Usa SLR per registrare il target scalabile e chiama l'API.put-scaling-policy
Funzionamento del dimensionamento predittivo
Utilizzate la scalabilità predittiva creando una politica di scalabilità predittiva che specifica la metrica da monitorare e analizzare. CloudWatch La scalabilità predittiva deve disporre di almeno 24 ore di dati per iniziare a prevedere i valori futuri.
Dopo aver creato la policy, la scalabilità predittiva inizia ad analizzare i dati metrici relativi agli ultimi 14 giorni per identificare i modelli. Questa analisi viene utilizzata per generare previsioni orarie del fabbisogno per le prossime 48 ore. I CloudWatch dati più recenti vengono utilizzati per aggiornare la previsione ogni sei ore. Con l'arrivo di nuovi dati, la scalabilità predittiva migliora continuamente l'accuratezza delle previsioni future.
La prima volta che abiliti la scalabilità predittiva, questa viene eseguita in modalità di sola previsione. Genera previsioni in questa modalità, ma non ridimensiona il servizio Amazon ECS in base a tali previsioni. Ciò significa che puoi valutare l'accuratezza e l'idoneità della previsione. È possibile visualizzare i dati di previsione utilizzando l'operazione GetPredictiveScalingForecast
API o il AWS Management Console.
Quando decidi di iniziare a utilizzare la scalabilità predittiva, passa la politica di scalabilità alla modalità previsione e scala. In questa modalità si verifica quanto segue.
Per impostazione predefinita, il tuo servizio Amazon ECS viene ridimensionato all'inizio di ogni ora in base alla previsione per quell'ora. Puoi scegliere di iniziare prima utilizzando la SchedulingBufferTime
proprietà nell'operazione PutScalingPolicy
API. Ciò consente l'avvio di nuove attività prima della domanda prevista e dà loro il tempo di avviarsi e prepararsi a gestire il traffico.
Limite massimo di attività
Quando registri i servizi Amazon ECS per la scalabilità, definisci un numero massimo di attività che possono essere avviate per servizio. Per impostazione predefinita, quando vengono impostate politiche di scalabilità, non è possibile aumentare il numero di attività oltre il limite massimo.
In alternativa, puoi consentire l'aumento automatico del numero massimo di attività del servizio se la previsione si avvicina o supera il numero massimo di attività del servizio Amazon ECS.
avvertimento
Fai attenzione quando consenti l'aumento automatico del numero massimo di attività. Ciò può comportare l'avvio di più attività del previsto, se l'aumento del numero massimo di attività non viene monitorato e gestito. L'aumento del numero massimo di attività diventa quindi il nuovo normale numero massimo di attività per il servizio Amazon ECS fino a quando non lo aggiorni manualmente. Il numero massimo di attività non torna automaticamente al massimo originale.
Regioni supportate
-
Stati Uniti orientali (Virginia settentrionale)
-
Stati Uniti orientali (Ohio)
-
Stati Uniti occidentali (California settentrionale)
-
Stati Uniti occidentali (Oregon)
-
Africa (Città del Capo)
-
Asia Pacifico (Hong Kong)
-
Asia Pacifico (Giacarta)
-
Asia Pacifico (Mumbai)
-
Asia Pacific (Osaka)
-
Asia Pacific (Seul)
-
Asia Pacifico (Singapore)
-
Asia Pacifico (Sydney)
-
Asia Pacifico (Tokyo)
-
Canada (Centrale)
-
Cina (Pechino)
-
China (Ningxia)
-
Europa (Francoforte)
-
Europa (Irlanda)
-
Europa (Londra)
-
Europa (Milano)
-
Europa (Parigi)
-
Europa (Stoccolma)
-
Medio Oriente (Bahrein)
-
Sud America (San Paolo)
-
AWS GovCloud (Stati Uniti orientali)
-
AWS GovCloud (Stati Uniti occidentali)