Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Quote del servizio Amazon Managed Service per Prometheus
Le due sezioni seguenti descrivono le quote e i limiti associati al servizio gestito da Amazon per Prometheus.
Quote del servizio
Il servizio gestito da Amazon per Prometheus prevede le seguenti quote. Amazon Managed Service for Prometheus fornisce metriche di utilizzo per monitorare l'utilizzo delle risorse di PrometheusCloudWatch . Utilizzando la funzione di allarme delle metriche di CloudWatch utilizzo di Amazon, puoi monitorare le risorse e l'utilizzo di Prometheus per evitare errori limite.
Man mano che i tuoi progetti e le tue aree di lavoro crescono, le quote più comuni che potresti dover monitorare o richiedere un aumento sono: Serie attiva per area di lavoro, tasso di importazione per area di lavoro e Dimensione del burst di importazione per area di lavoro.
Per tutte le quote regolabili, puoi richiedere un aumento della quota selezionando il link nella colonna Regolabile o richiedendo un aumento della quota
Il limite della serie attiva per area di lavoro viene applicato dinamicamente. Per ulteriori informazioni, consulta Quote predefinite della serie attiva. La velocità di ingestione per area di lavoro e la dimensione di ingestione burst per area di lavoro controllano insieme la velocità con cui è possibile importare i dati nell'area di lavoro. Per ulteriori informazioni, consulta Limitazione dell'ingestione.
Nota
Salvo diversa indicazione, queste quote si intendono per area di lavoro. Il valore massimo per le serie attive per area di lavoro è di un miliardo.
Nome | Predefinita | Adattabile | Descrizione |
---|---|---|---|
Parametri attivi con metadati per area di lavoro | Ogni regione supportata: 20.000 | No | Numero di parametri attivi univoci con metadati per area di lavoro: 20.000 Nota: se viene raggiunto il limite, viene registrato il campione metrico, ma i metadati che superano il limite vengono eliminati. |
Serie attive per area di lavoro | Ogni regione supportata: 50.000.000 | Sì |
Il numero di serie attive uniche per area di lavoro (fino a un massimo di 1 miliardo). Una serie è attiva se un campione è stato segnalato nelle ultime 2 ore. La capacità da 2 M a 50 M viene regolata automaticamente in base agli ultimi 30 minuti di utilizzo. |
Dimensione del gruppo di aggregazione avvisi nel file di definizione di alert manager | Ogni regione supportata: 1.000 | Sì |
La dimensione massima di un gruppo di aggregazione degli avvisi nel file di definizione di alert manager. Ogni combinazione di valori di etichetta di group_by creerebbe un gruppo di aggregazione. |
Dimensione del file di definizione del gestore avvisi | Ogni regione supportata: 1 | No | La dimensione massima di un file di definizione di Alert Manager, in megabyte. |
Dimensione del payload degli avvisi in Alert Manager | Ogni regione supportata: 20 | No | La dimensione massima del payload degli avvisi di Alert Manager per area di lavoro, in megabyte. La dimensione degli avvisi dipende dalle etichette e dalle annotazioni. |
Avvisi in Alert Manager | Ogni regione supportata: 1.000 | Sì |
Il numero massimo di avvisi simultanei di Alert Manager per area di lavoro. |
Cluster di tracker HA | Ogni regione supportata: 500 | No | Il numero massimo di cluster di cui il tracker HA terrà traccia per i campioni ingeriti per area di lavoro. |
Tasso di importazione per area di lavoro | Ogni regione supportata: 170.000 | Sì |
Frequenza dei parametri di importazione dei campioni per area di lavoro al secondo. |
Regole di inibizione nel file di definizione di alert manager | Ogni regione supportata: 100 | Sì |
Il numero massimo di regole di inibizione nel file di definizione di alert manager. |
Dimensione etichetta | Ogni regione supportata: 7 | No | La dimensione massima combinata di tutte le etichette e i valori delle etichette accettati per una serie, in kilobyte. |
LabelSet limiti per area di lavoro | Ogni regione supportata: 100 | Sì |
Il numero massimo di limiti di labelset che possono essere creati per area di lavoro. |
Etichette per serie di parametri | Ogni regione supportata: 150 | Sì |
Numero di etichette per serie di parametri. |
Lunghezza dei metadati | Ogni regione supportata: 1 | No | La lunghezza massima accettata per i metadati metrici, in kilobyte. I metadati si riferiscono al nome della metrica, al tipo, all'unità e al testo di aiuto. |
Metadati per parametro | Ogni regione supportata: 10 | No | Numero di metadati per parametro. Nota: se il limite viene raggiunto, il campione metrico viene registrato, ma i metadati che superano il limite vengono eliminati. |
Nodi nell'albero di instradamento di alert manager | Ogni regione supportata: 100 | Sì |
Il numero massimo di nodi nell'albero di instradamento di alert manager. |
Numero di operazioni API per regione in transazioni al secondo | Ogni regione supportata: 10 | Sì |
Il numero massimo di operazioni API al secondo per regione per tutti gli Amazon Managed Service for APIs Prometheus, inclusi workspace APIs CRUD, APIs tagging, group di regole, namespace CRUD e alert manager definition CRUD. APIs APIs |
Numero e operazioni API per area di lavoro nelle transazioni GetSeries al secondo GetLabels GetMetricMetadata | Ogni regione supportata: 10 | No | Il numero massimo di GetSeries operazioni API GetMetricMetadata compatibili con Prometheus al secondo per area di lavoro. GetLabels |
Numero di operazioni QueryMetrics API per area di lavoro in transazioni al secondo | Ogni regione supportata: 300 | No | Il numero massimo di operazioni API QueryMetrics compatibili con Prometheus al secondo per area di lavoro. |
Numero di operazioni RemoteWrite API per area di lavoro in transazioni al secondo | Ogni regione supportata: 3.000 | No | Il numero massimo di operazioni API RemoteWrite compatibili con Prometheus al secondo per area di lavoro. |
Numero di altre operazioni API compatibili con Prometheus per area di lavoro in transazioni al secondo | Ogni regione supportata: 100 | No | Il numero massimo di operazioni API al secondo per area di lavoro per tutte le altre applicazioni compatibili con Prometheus APIs , tra cui, ecc. ListAlerts ListRules |
Byte di query per query istantanee | Ogni Regione supportata: 5 | No | Il numero massimo di byte che possono essere scansionati da una singola query istantanea, in gigabyte. |
Byte di query per query di intervallo | Ogni Regione supportata: 5 | No | Il numero massimo di byte che è possibile scansionare per intervallo di 24 ore in una query a intervallo singolo, in gigabyte. |
Esempi di query | Ogni regione supportata: 50.000.000 | No | Il numero massimo di campioni che possono essere scansionati durante una singola query. |
Serie di query recuperata | Ogni regione supportata: 12.000.000 | No | Il numero massimo di serie che possono essere scansionati durante una singola query. |
Intervallo di tempo delle query in giorni | Ogni regione supportata: 95 | No | L'intervallo di tempo massimo di QueryMetrics GetSeries, e GetLabels APIs. |
Dimensione richiesta | Ogni regione supportata: 1 | No | La dimensione massima della richiesta per l'inserimento o l'interrogazione, in megabyte. |
Intervallo di valutazione delle regole | Ogni regione supportata: 30 | Sì |
L'intervallo minimo di valutazione delle regole di un gruppo di regole per area di lavoro, in secondi. |
Dimensione del file di definizione del namespace del gruppo di regole | Ogni regione supportata: 1 | No | La dimensione massima di un file di definizione dello spazio dei nomi di un gruppo di regole, in megabyte. |
Regole per area di lavoro | Ogni regione supportata: 2.000 | Sì |
Il numero massimo di regole per area di lavoro. |
Silenzi per area di lavoro | Ogni regione supportata: 1.000 | Sì |
Numero massimo di silenzi, inclusi quelli scaduti, attivi e in sospeso, per area di lavoro. |
Modelli nel file di definizione di alert manager | Ogni regione supportata: 100 | Sì |
Il numero massimo di modelli nel file di definizione di alert manager. |
Area di lavoro per regione per account | Ogni regione supportata: 25 | Sì |
Il numero massimo di aree di lavoro per regione. |
Quote predefinite della serie attiva
Le aree di lavoro di Amazon Managed Service for Prometheus si adattano automaticamente all'utilizzo di importazione. All'aumentare dell'utilizzo, il servizio aumenta automaticamente la capacità delle serie temporali fino alla quota predefinita.
L'area di lavoro Amazon Managed Service for Prometheus si ridimensiona automaticamente, in base all'utilizzo, in due modi:
-
Quando l'utilizzo medio di 30 minuti è inferiore a 5 milioni di serie, la capacità raddoppia (ad esempio, un'area di lavoro con 3,5 milioni di utilizzo ottiene 7 milioni di capacità).
-
Quando l'utilizzo supera i 5 milioni di serie, l'area di lavoro aggiunge un buffer di 10 milioni (ad esempio, un'area di lavoro con 25 milioni di utilizzo ottiene 35 milioni di capacità).
Amazon Managed Service for Prometheus alloca automaticamente più capacità all'aumentare dell'ingestione, fino a raggiungere la quota stabilita. Questo aiuta a garantire che il carico di lavoro non subisca un rallentamento prolungato. Tuttavia, si può verificare una limitazione se si raddoppiano o si superano i 10 milioni rispetto al valore di base precedente calcolato negli ultimi 30 minuti. Per evitare limitazioni, Amazon Managed Service for Prometheus consiglia di aumentare gradualmente l'ingestione quando si supera il livello di riferimento precedente.
Nota
La capacità minima per le serie temporali attive è di 2 milioni e non è prevista alcuna limitazione quando si hanno meno di 2 milioni di serie.
Per superare la quota predefinita, puoi richiedere un aumento della quota
Scalare al di sopra della quota predefinita
Quando richiedi un aumento della quota oltre la quota predefinita delle serie attive, Amazon Managed Service for Prometheus regola di conseguenza la capacità del tuo spazio di lavoro. Se non utilizzi appieno la maggiore capacità, il servizio recupererà la parte inutilizzata nel tempo. Man mano che l'utilizzo aumenta, l'area di lavoro verrà nuovamente ridimensionata automaticamente.
Tuttavia, si può verificare una limitazione se si raddoppiano o si superano i 50 milioni di serie temporali attive rispetto alla precedente baseline calcolata nelle ultime 2 ore. Per esempio:
-
Se la tua quota è di 100 milioni e la tua linea di base è di 30 milioni, puoi aumentare fino a 60 milioni entro 2 ore senza limitazioni.
-
Se la tua quota è di 100 milioni e la tua linea di base è di 50 milioni, puoi aumentare fino a raggiungere tutti i 100 milioni entro 2 ore senza limitazioni.
Limitazione dell'ingestione
Amazon Managed Service for Prometheus limita l'ingestione per ogni area di lavoro, in base ai tuoi limiti attuali. Questo aiuta a mantenere le prestazioni dell'area di lavoro. Se superi il limite, lo vedrai DiscardedSamples
nelle CloudWatch metriche (con il rate_limited
motivo). Puoi utilizzarlo CloudWatch per monitorare l'ingestione e per creare un allarme per avvisarti quando stai per raggiungere i limiti di limitazione. Per ulteriori informazioni, consulta Usa i CloudWatch parametri per monitorare le risorse di Amazon Managed Service for Prometheus.
Amazon Managed Service for Prometheus utilizza l'algoritmo token bucket per implementare il throttling dell'ingestione
Ogni campione di dati ingerito rimuove un token dal bucket. Se la dimensione del bucket (dimensione del burst di Ingestion per workspace) è 1.000.000, lo spazio di lavoro può importare un milione di campioni di dati in un secondo. Se supera il milione di campioni da importare, verrà limitato e non inserirà più record. I campioni di dati aggiuntivi verranno eliminati.
Il secchio si ricarica automaticamente a una velocità prestabilita. Se il bucket è al di sotto della sua capacità massima, gli viene aggiunto un determinato numero di token ogni secondo fino a raggiungere la capacità massima. Se il secchio è pieno quando arrivano i gettoni di ricarica, questi vengono scartati. Il bucket non può contenere più del numero massimo di token. La frequenza di ricarica per l'ingestione del campione è impostata dal limite della frequenza di ingestione per area di lavoro. Se la frequenza di ingestione per area di lavoro è impostata su 170.000, la frequenza di ricarica per il bucket è di 170.000 token al secondo.
Se il tuo spazio di lavoro acquisisce 1.000.000 di campioni di dati in un secondo, il tuo bucket viene immediatamente ridotto a zero token. Il bucket viene quindi ricaricato con 170.000 token ogni secondo, fino a raggiungere la capacità massima di 1.000.000 di token. Se non viene più effettuata alcuna operazione di ingestione, il bucket precedentemente vuoto tornerà alla sua capacità massima in 6 secondi.
Nota
L'ingestione avviene in richieste in batch. Se hai 100 token disponibili e invii una richiesta con 101 campioni, l'intera richiesta viene rifiutata. Amazon Managed Service for Prometheus non accetta richieste parzialmente. Se stai scrivendo un raccoglitore, puoi gestire i nuovi tentativi (con batch più piccoli o dopo un certo periodo di tempo).
Non è necessario attendere che il bucket sia pieno prima che l'area di lavoro possa importare altri campioni di dati. È possibile utilizzare i token man mano che vengono aggiunti al bucket. Se si utilizzano immediatamente i gettoni di ricarica, il secchio non raggiunge la sua capacità massima. Ad esempio, se esaurisci il bucket, puoi continuare a importare 170.000 campioni di dati al secondo. Il bucket può essere ricaricato fino alla capacità massima solo se si inseriscono meno di 170.000 campioni di dati al secondo.
Limiti aggiuntivi per i dati importati
Il servizio gestito da Amazon per Prometheus prevede quote aggiuntive per i dati che vengono importati nell'area di lavoro. Queste non sono regolabili.
-
I campioni dei parametri più vecchi di 1 ora non possono essere acquisiti.
-
Ogni campione e i metadati devono avere un nome per il parametro.