Quote del servizio Quote predefinite della serie attiva Scalare al di sopra della quota predefinita Limitazione dell'ingestione Limiti aggiuntivi per i dati importati

Quote del servizio Amazon Managed Service per Prometheus

Le due sezioni seguenti descrivono le quote e i limiti associati al servizio gestito da Amazon per Prometheus.

Quote del servizio

Il servizio gestito da Amazon per Prometheus prevede le seguenti quote. Amazon Managed Service for Prometheus fornisce metriche di utilizzo per monitorare l'utilizzo delle risorse di PrometheusCloudWatch . Utilizzando la funzione di allarme delle metriche di CloudWatch utilizzo di Amazon, puoi monitorare le risorse e l'utilizzo di Prometheus per evitare errori limite.

Man mano che i tuoi progetti e le tue aree di lavoro crescono, le quote più comuni che dovresti monitorare o richiedere un aumento sono: serie Active per area di lavoro e velocità di ingestione per area di lavoro.

Per tutte le quote regolabili, puoi richiedere un aumento della quota scegliendo il link nella colonna Regolabile o richiedendo un aumento della quota.

Il limite della serie attiva per area di lavoro viene applicato dinamicamente. Per ulteriori informazioni, consulta Quote predefinite della serie attiva. La percentuale di ingestione per quota di spazio di lavoro determina la velocità con cui è possibile importare i dati nell'area di lavoro. Per ulteriori informazioni, consulta Limitazione dell'ingestione.

Nota

Salvo diversa indicazione, queste quote si intendono per area di lavoro. Il valore massimo per le serie attive per area di lavoro è di un miliardo.

Nome	Predefinita	Adattabile	Description
Parametri attivi con metadati per area di lavoro	Ogni regione supportata: 20.000	No	Numero di parametri attivi univoci con metadati per area di lavoro: 20.000 Nota: se viene raggiunto il limite, viene registrato il campione metrico, ma i metadati che superano il limite vengono eliminati.
Serie attive per area di lavoro	Ogni regione supportata: 50.000.000	Sì	Il numero di serie attive uniche per area di lavoro (fino a un massimo di 1 miliardo). Una serie è attiva se un campione è stato segnalato nelle ultime 2 ore. La capacità da 2 M a 50 M viene regolata automaticamente in base agli ultimi 30 minuti di utilizzo.
Dimensione del gruppo di aggregazione avvisi nel file di definizione di alert manager	Ogni regione supportata: 1.000	Sì	La dimensione massima di un gruppo di aggregazione degli avvisi nel file di definizione di alert manager. Ogni combinazione di valori di etichetta di group_by creerebbe un gruppo di aggregazione.
Dimensione del file di definizione del gestore avvisi	Ogni regione supportata: 1.000.000	No	La dimensione massima di un file di definizione di Alert Manager, in byte.
Dimensione del payload degli avvisi in Alert Manager	Ogni regione supportata: 20.000.000	No	La dimensione massima del payload degli avvisi di Alert Manager per area di lavoro, in byte. La dimensione degli avvisi dipende dalle etichette e dalle annotazioni.
Avvisi in Alert Manager	Ogni regione supportata: 1.000	Sì	Il numero massimo di avvisi simultanei di Alert Manager per area di lavoro.
Cluster di tracker HA	Ogni regione supportata: 500	No	Il numero massimo di cluster di cui il tracker HA terrà traccia per i campioni ingeriti per area di lavoro.
Tasso di importazione per area di lavoro	Ogni regione supportata: 1.666.666	Sì	Frequenza dei parametri di importazione dei campioni per area di lavoro al secondo. Il limite viene regolato automaticamente in modo da corrispondere alla serie attiva per limite 1/30 di area di lavoro, fino a 1.666.666.
Regole di inibizione nel file di definizione di alert manager	Ogni regione supportata: 100	Sì	Il numero massimo di regole di inibizione nel file di definizione di alert manager.
Dimensione etichetta	Ogni regione supportata: 7	No	La dimensione massima combinata di tutte le etichette e i valori delle etichette accettati per una serie, in kilobyte.
LabelSet limiti per area di lavoro	Ogni regione supportata: 100	Sì	Il numero massimo di limiti di labelset che possono essere creati per area di lavoro.
Etichette per serie di parametri	Ogni regione supportata: 150	Sì	Numero di etichette per serie di parametri.
Numero massimo di bucket di istogrammi nativi	Ogni Regione supportata: 200	No	Il numero totale massimo di bucket consentito in un campione di istogramma nativo. La risoluzione di un istogramma con più bucket verrà ridotta fino a quando il numero di bucket non rientra nel limite.
Lunghezza dei metadati	Ogni regione supportata: 1	No	La lunghezza massima accettata per i metadati metrici, in kilobyte. I metadati si riferiscono al nome della metrica, al tipo, all'unità e al testo di aiuto.
Metadati per parametro	Ogni regione supportata: 10	No	Numero di metadati per parametro. Nota: se il limite viene raggiunto, il campione metrico viene registrato, ma i metadati che superano il limite vengono eliminati.
Serie attive di istogrammi nativi per area di lavoro	Ogni regione supportata: 5.000.000	Sì	Il numero di serie attive uniche di Native Histogram per area di lavoro. Una serie è attiva se un campione è stato segnalato nelle ultime 2 ore. Il limite viene regolato automaticamente in modo che corrisponda al 10% del limite delle serie attive del workspace o al valore predefinito, a seconda di quale tra i due sia maggiore.
Frequenza di inserimento dell'istogramma nativa per area di lavoro	Ogni regione supportata: 166.666	Sì	Frequenza di acquisizione dei campioni di istogramma nativo per area di lavoro al secondo. Il limite viene regolato automaticamente in modo che corrisponda al 10% del limite di velocità di ingestione degli spazi di lavoro o al valore predefinito, a seconda di quale tra i due sia maggiore.
Nodi nell'albero di instradamento di alert manager	Ogni regione supportata: 100	Sì	Il numero massimo di nodi nell'albero di instradamento di alert manager.
Numero di operazioni API per regione in transazioni al secondo	Ogni regione supportata: 10	Sì	Il numero massimo di operazioni API al secondo per regione per tutte le API di Amazon Managed Service for Prometheus, incluse le API CRUD di workspace, le API di tagging, le API CRUD per i namespace di gruppi di regole e le API CRUD per la definizione degli alert manager.
GetSeriesNumero GetLabels di operazioni GetMetricMetadata API e per area di lavoro nelle transazioni al secondo	Ogni regione supportata: 10	No	Il numero massimo di GetSeries operazioni GetMetricMetadata Prometheus-compatible API GetLabels e al secondo per area di lavoro.
Numero di operazioni QueryMetrics API per area di lavoro in transazioni al secondo	Ogni regione supportata: 300	No	Il numero massimo di operazioni QueryMetrics Prometheus-compatible API al secondo per area di lavoro.
Numero di operazioni RemoteWrite API per area di lavoro in transazioni al secondo	Ogni regione supportata: 3.000	No	Il numero massimo di operazioni RemoteWrite Prometheus-compatible API al secondo per area di lavoro.
Numero di altre operazioni Prometheus-compatible API per area di lavoro in transazioni al secondo	Ogni regione supportata: 100	No	Il numero massimo di operazioni API al secondo per area di lavoro per tutte le altre Prometheus-compatible API ListAlerts, tra cui, ecc. ListRules
Percentuale di ingestione fuori servizio per area di lavoro	Ogni regione supportata: 83.333	Sì	Frequenza di ingestione di campioni fuori servizio per area di lavoro al secondo. A meno che non venga sovrascritto, il limite viene regolato automaticamente in modo da corrispondere al 5% della velocità di ingestione per limite di area di lavoro.
Finestra temporale fuori servizio per area di lavoro	Ogni regione supportata: 600	Sì	La finestra temporale massima per i campioni fuori servizio per area di lavoro, in secondi.
Byte di query per query istantanee	Ogni Regione supportata: 5	No	Il numero massimo di byte che possono essere scansionati con una singola query istantanea, in gigabyte.
Byte di query per query di intervallo	Ogni Regione supportata: 5	No	Il numero massimo di byte che è possibile scansionare per intervallo di 24 ore in una query a intervallo singolo, in gigabyte.
Esempi di query	Ogni regione supportata: 50.000.000	No	Il numero massimo di campioni che è possibile scansionare per intervallo di 24 ore in una query a intervallo singolo o in una singola query istantanea.
Serie di query recuperata	Ogni regione supportata: 12.000.000	No	Il numero massimo di serie che è possibile scansionare per intervallo di 24 ore in una query a intervallo singolo o in una singola query istantanea.
Intervallo di tempo delle query in giorni	Ogni regione supportata: 95	No	L'intervallo di tempo massimo di QueryMetrics GetSeries, e le GetLabels API.
Dimensione richiesta	Ogni regione supportata: 1	No	La dimensione massima della richiesta per l'inserimento o l'interrogazione, in megabyte.
Intervallo di valutazione delle regole	Ogni regione supportata: 30	Sì	L'intervallo minimo di valutazione delle regole di un gruppo di regole per area di lavoro, in secondi.
Dimensione del file di definizione del namespace del gruppo di regole	Ogni regione supportata: 1.000.000	No	La dimensione massima di un file di definizione dello spazio dei nomi di un gruppo di regole, in byte.
Regole per area di lavoro	Ogni regione supportata: 2.000	Sì	Il numero massimo di regole per area di lavoro.
Silenzi per area di lavoro	Ogni regione supportata: 1.000	Sì	Numero massimo di silenzi, inclusi quelli scaduti, attivi e in sospeso, per area di lavoro.
Modelli nel file di definizione di alert manager	Ogni regione supportata: 100	Sì	Il numero massimo di modelli nel file di definizione di alert manager.
Area di lavoro per regione per account	Ogni regione supportata: 25	Sì	Il numero massimo di aree di lavoro per regione.

Quote predefinite della serie attiva

Le aree di lavoro di Amazon Managed Service for Prometheus si adattano automaticamente all'utilizzo di importazione. All'aumentare dell'utilizzo, il servizio aumenta automaticamente la capacità delle serie temporali fino alla quota predefinita.

L'area di lavoro Amazon Managed Service for Prometheus si ridimensiona automaticamente, in base all'utilizzo, in due modi:

Quando l'utilizzo medio di 30 minuti è inferiore a 5 milioni di serie, la capacità raddoppia (ad esempio, un'area di lavoro con 3,5 milioni di utilizzo ottiene 7 milioni di capacità).
Quando l'utilizzo supera i 5 milioni di serie, l'area di lavoro aggiunge un buffer di 10 milioni (ad esempio, un'area di lavoro con 25 milioni di utilizzo ottiene 35 milioni di capacità).

Amazon Managed Service for Prometheus alloca automaticamente più capacità all'aumentare dell'ingestione, fino a raggiungere la quota stabilita. Questo aiuta a garantire che il carico di lavoro non subisca un rallentamento prolungato. Tuttavia, si può verificare una limitazione se si raddoppiano o si superano i 10 milioni rispetto al valore di base precedente calcolato negli ultimi 30 minuti. Per evitare limitazioni, Amazon Managed Service for Prometheus consiglia di aumentare gradualmente l'ingestione quando si supera il livello di riferimento precedente.

Nota

La capacità minima per le serie temporali attive è di 2 milioni e non è prevista alcuna limitazione quando si hanno meno di 2 milioni di serie.

Per superare la quota predefinita, puoi richiedere un aumento della quota.

Scalare al di sopra della quota predefinita

Quando richiedi un aumento della quota oltre la quota predefinita delle serie attive, Amazon Managed Service for Prometheus regola di conseguenza la capacità del tuo spazio di lavoro. Se non utilizzi appieno la maggiore capacità, il servizio recupererà la parte inutilizzata nel tempo. Man mano che l'utilizzo aumenta, l'area di lavoro verrà nuovamente ridimensionata automaticamente.

Tuttavia, si può verificare una limitazione se si raddoppiano o si superano i 50 milioni di serie temporali attive rispetto alla precedente baseline calcolata nelle ultime 2 ore. Esempio:

Se la tua quota è di 100 milioni e la tua linea di base è di 30 milioni, puoi aumentare fino a 60 milioni entro 2 ore senza limitazioni.
Se la tua quota è di 100 milioni e la tua linea di base è di 50 milioni, puoi aumentare fino a raggiungere tutti i 100 milioni entro 2 ore senza limitazioni.

Limitazione dell'ingestione

Amazon Managed Service for Prometheus limita l'ingestione per ogni area di lavoro, in base ai tuoi limiti attuali. Questo aiuta a mantenere le prestazioni dell'area di lavoro. Se superi il limite, lo vedrai DiscardedSamples nelle CloudWatch metriche (con il rate_limited motivo). Puoi utilizzarlo CloudWatch per monitorare l'ingestione e creare un allarme per avvisarti quando stai per raggiungere i limiti di limitazione. Per ulteriori informazioni, consulta Usa i CloudWatch parametri per monitorare le risorse di Amazon Managed Service for Prometheus.

Amazon Managed Service for Prometheus utilizza l'algoritmo token bucket per implementare il throttling dell'ingestione. Con questo algoritmo, il tuo account dispone di un bucket che contiene un numero specifico di token. Il numero di token nel bucket rappresenta il limite di ingestione in un dato secondo.

Ogni campione di dati ingerito rimuove un token dal bucket. Se la dimensione del bucket (tasso di ingestione per area di lavoro) è 1.000.000, l'area di lavoro può importare un milione di campioni di dati in un secondo. Se supera il milione di campioni da importare, verrà limitato e non inserirà più record. I campioni di dati aggiuntivi verranno eliminati.

Il secchio si ricarica automaticamente a una velocità prestabilita. Se il bucket è al di sotto della sua capacità massima, gli viene aggiunto un determinato numero di token ogni secondo fino a raggiungere la capacità massima. Se il secchio è pieno quando arrivano i gettoni di ricarica, questi vengono scartati. Il bucket non può contenere più del numero massimo di token. La frequenza di ricarica per l'ingestione del campione è impostata dal limite della frequenza di ingestione per area di lavoro. Se la frequenza di ingestione per area di lavoro è impostata su 170.000, la frequenza di ricarica per il bucket è di 170.000 token al secondo.

Se il tuo spazio di lavoro acquisisce 1.000.000 di campioni di dati in un secondo, il tuo bucket viene immediatamente ridotto a zero token. Il bucket viene quindi ricaricato con 170.000 token ogni secondo, fino a raggiungere la capacità massima di 1.000.000 di token. Se non viene più effettuata alcuna operazione di ingestione, il bucket precedentemente vuoto tornerà alla sua capacità massima in 6 secondi.

Nota

L'ingestione avviene in richieste in batch. Se hai 100 token disponibili e invii una richiesta con 101 campioni, l'intera richiesta viene rifiutata. Amazon Managed Service for Prometheus non accetta richieste parzialmente. Se stai scrivendo un raccoglitore, puoi gestire i nuovi tentativi (con batch più piccoli o dopo un certo periodo di tempo).

Non è necessario attendere che il bucket sia pieno prima che l'area di lavoro possa importare altri campioni di dati. È possibile utilizzare i token man mano che vengono aggiunti al bucket. Se si utilizzano immediatamente i gettoni di ricarica, il secchio non raggiunge la sua capacità massima. Ad esempio, se esaurisci il bucket, puoi continuare a importare 170.000 campioni di dati al secondo. Il bucket può essere ricaricato fino alla capacità massima solo se si inseriscono meno di 170.000 campioni di dati al secondo.

Limiti aggiuntivi per i dati importati

Il servizio gestito da Amazon per Prometheus prevede quote aggiuntive per i dati che vengono importati nell'area di lavoro. Queste non sono regolabili.

I campioni dei parametri più vecchi di 1 ora non possono essere acquisiti.
Ogni campione e i metadati devono avere un nome per il parametro.
I campioni di istogramma nativi devono avere un valore di schema compreso tra -4 e 8. I campioni con uno schema al di fuori di questo intervallo vengono scartati.
I campioni di istogramma nativi non devono superare le dimensioni di 2048 byte. I campioni che superano questo limite vengono scartati.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Rimuovere un tag da un namespace dei gruppi di regole

Documentazione di riferimento delle API