Quotas de service Quotas par défaut des séries actives Dépasser le quota par défaut Régulation de l'ingestion Limites supplémentaires relatives aux données ingérées

Service Quotas d’Amazon Managed Service for Prometheus

Les deux sections suivantes décrivent les quotas et limites associés à Amazon Managed Service for Prometheus.

Quotas de service

Amazon Managed Service for Prometheus comporte les quotas suivants. Amazon Managed Service for Prometheus fournit des statistiques d'utilisation pour surveiller l'CloudWatch utilisation des ressources de Prometheus. À l'aide de la fonction d'alarme des métriques d' CloudWatch utilisation d'Amazon, vous pouvez surveiller les ressources et l'utilisation de Prometheus afin d'éviter les erreurs de limite.

Au fur et à mesure que vos projets et espaces de travail se développent, les quotas les plus courants que vous devez surveiller ou pour lesquels vous devez demander une augmentation sont les suivants : séries actives par espace de travail et taux d'ingestion par espace de travail.

Pour tous les quotas ajustables, vous pouvez demander une augmentation de quota en cliquant sur le lien dans la colonne Réglable ou en demandant une augmentation de quota.

La limite de séries actives par espace de travail s’applique dynamiquement. Pour de plus amples informations, veuillez consulter Quotas par défaut des séries actives. Le taux d'ingestion par quota d'espace de travail détermine la rapidité avec laquelle vous pouvez ingérer des données dans votre espace de travail. Pour de plus amples informations, veuillez consulter Régulation de l'ingestion.

Note

Sauf indication contraire, ces quotas s’entendent par espace de travail. La valeur maximale des séries actives par espace de travail est d'un milliard.

Nom	Par défaut	Ajustable	Description
Métriques actives avec métadonnées par espace de travail	Chaque Région prise en charge : 20 000	Non	Nombre de métriques actives uniques avec métadonnées par espace de travail. Remarque : Si la limite est atteinte, l'échantillon métrique est enregistré, mais les métadonnées dépassant cette limite sont supprimées.
Séries actives par espace de travail	Chaque Région prise en charge : 50 000 000	Oui	Le nombre de séries actives uniques par espace de travail (jusqu'à un milliard au maximum). Une série est active si un échantillon a été signalé au cours des 2 dernières heures. La capacité de 2 M à 50 M est automatiquement ajustée en fonction des 30 dernières minutes d'utilisation.
Taille du groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes	Chaque Région prise en charge : 1 000	Oui	Taille maximale d’un groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes. Chaque combinaison de valeurs d’étiquette group_by crée un groupe d’agrégation.
Taille du fichier de définition du gestionnaire d’alertes	Chaque région prise en charge : 1 000 000	Non	Taille maximale d'un fichier de définition du gestionnaire d'alertes, en octets.
Taille de la charge utile des alertes dans Alert Manager	Chaque région prise en charge : 20 000 000	Non	Taille maximale de la charge utile de toutes les alertes Alert Manager par espace de travail, en octets. La taille de l’alerte dépend des étiquettes et des annotations.
Alertes dans le gestionnaire d'alertes	Chaque Région prise en charge : 1 000	Oui	Nombre maximal d'alertes Alert Manager simultanées par espace de travail.
Clusters de suivi de la haute disponibilité	Chaque région prise en charge : 500	Non	Nombre maximal de clusters que le dispositif de suivi de la haute disponibilité suivra pour les échantillons ingérés par espace de travail.
Taux d’ingestion par espace de travail	Chaque région prise en charge : 1 666 666	Oui	Taux d’ingestion d’échantillons de métriques par espace de travail et par seconde. La limite est automatiquement ajustée pour correspondre à 1/30 la série active par limite d'espace de travail, jusqu'à 1 666 666.
Règles d’inhibition dans le fichier de définition du gestionnaire d’alertes	Chaque région prise en charge : 100	Oui	Nombre maximal de règles d’inhibition dans le fichier de définition du gestionnaire d’alertes.
Taille de l’étiquette	Chaque région prise en charge : 7	Non	Taille combinée maximale de toutes les étiquettes et valeurs d'étiquette acceptées pour une série, en kilo-octets.
LabelSet limites par espace de travail	Chaque région prise en charge : 100	Oui	Nombre maximum de limites de jeux d'étiquettes pouvant être créées par espace de travail.
Étiquettes par série de métriques	Chaque Région prise en charge : 150	Oui	Nombre d’étiquettes par série de métriques.
Longueur des métadonnées	Par région prise en charge : 1	Non	Longueur maximale acceptée pour les métadonnées métriques, en kilo-octets. Les métadonnées font référence au nom, au type, à l'unité et au texte d'aide de la métrique.
Métadonnées par métrique	Chaque Région prise en charge : 10	Non	Nombre de métadonnées par métrique. Remarque : Si la limite est atteinte, l'échantillon métrique est enregistré, mais les métadonnées dépassant cette limite sont supprimées.
Nœuds dans l’arborescence de routage du gestionnaire d’alertes	Chaque région prise en charge : 100	Oui	Nombre maximal de nœuds dans l’arborescence de routage du gestionnaire d’alertes.
Nombre d'opérations d'API par région en transactions par seconde	Par région prise en charge : 10	Oui	Le nombre maximum d'opérations d'API par seconde et par région pour toutes les API Amazon Managed Service for Prometheus, y compris les API CRUD d'espace de travail, les API de balisage, les API CRUD d'espace de noms de groupes de règles et les API CRUD de définition du gestionnaire d'alertes.
Nombre d' GetSeriesopérations GetLabels et d' GetMetricMetadata API par espace de travail en transactions par seconde	Chaque Région prise en charge : 10	Non	Le nombre maximum d' GetSeriesopérations GetLabels et d' GetMetricMetadata Prometheus-compatible API par seconde et par espace de travail.
Nombre d'opérations d' QueryMetrics API par espace de travail en transactions par seconde	Chaque région prise en charge : 300	Non	Le nombre maximum d'opérations d' QueryMetrics Prometheus-compatible API par seconde et par espace de travail.
Nombre d'opérations d' RemoteWrite API par espace de travail en transactions par seconde	Chaque Région prise en charge : 3 000	Non	Le nombre maximum d'opérations d' RemoteWrite Prometheus-compatible API par seconde et par espace de travail.
Nombre d'autres opérations d' Prometheus-compatible API par espace de travail en transactions par seconde	Chaque région prise en charge : 100	Non	Le nombre maximum d'opérations d'API par seconde et par espace de travail pour toutes les autres Prometheus-compatible API ListAlerts ListRules, y compris, etc.
Taux d'ingestion de produits hors service par espace de travail	Chaque région prise en charge : 83 333	Oui	Taux d'ingestion d'échantillons hors service par espace de travail et par seconde. À moins d'être remplacée, la limite est automatiquement ajustée à 5 % du taux d'ingestion par limite d'espace de travail.
Période hors service par espace de travail	Chaque région prise en charge : 600	Oui	Période maximale pour les échantillons hors service par espace de travail, en secondes.
Octets de requête pour les requêtes instantanées	Chaque région prise en charge : 5	Non	Nombre maximal d'octets pouvant être analysés par une seule requête instantanée, en gigaoctets.
Octets de requête pour les requêtes de plage	Chaque région prise en charge : 5	Non	Nombre maximal d'octets pouvant être analysés par intervalle de 24 heures dans le cadre d'une requête à plage unique, en gigaoctets.
Exemples de requête	Chaque Région prise en charge : 50 000 000	Non	Nombre maximal d'échantillons pouvant être numérisés par intervalle de 24 heures dans le cadre d'une seule requête par plage ou d'une seule requête instantanée.
Série de requêtes récupérée	Chaque Région prise en charge : 12 000 000	Non	Nombre maximal de séries pouvant être numérisées par intervalle de 24 heures dans le cadre d'une seule requête par plage ou d'une seule requête instantanée.
Plage de temps de requête en jours	Chaque région prise en charge : 95	Non	La plage de temps maximale de QueryMetrics GetSeries, et les GetLabels API.
Taille des demandes	Par région prise en charge : 1	Non	Taille maximale de requête pour l'ingestion ou la requête, en mégaoctets.
Intervalle d’évaluation des règles	Chaque Région prise en charge : 30	Oui	Intervalle minimal d'évaluation des règles d'un groupe de règles par espace de travail, en secondes.
Taille du fichier de définition de l’espace de noms de groupes de règles	Chaque région prise en charge : 1 000 000	Non	Taille maximale d'un fichier de définition d'espace de noms de groupe de règles, en octets.
Règles par espace de travail	Chaque Région prise en charge : 2 000	Oui	Nombre maximal de règles par espace de travail.
Silences par espace de travail	Chaque Région prise en charge : 1 000	Oui	Nombre maximum de silences, y compris les silences expirés, actifs et en attente, par espace de travail.
Modèles dans le fichier de définition du gestionnaire d’alertes	Chaque région prise en charge : 100	Oui	Nombre maximal de modèles dans le fichier de définition du gestionnaire d’alertes.
Espaces de travail par région et par compte	Chaque région prise en charge : 25	Oui	Nombre maximal d’espaces de travail par région.

Quotas par défaut des séries actives

Les espaces de travail Amazon Managed Service for Prometheus s'adaptent automatiquement à votre consommation d'ingestion. À mesure que votre utilisation augmente, le service augmente automatiquement la capacité de vos séries chronologiques jusqu'au quota par défaut.

Votre espace de travail Amazon Managed Service for Prometheus évolue automatiquement, en fonction de votre utilisation, de deux manières :

Lorsque votre utilisation moyenne sur 30 minutes est inférieure à 5 millions de séries, la capacité double (par exemple, un espace de travail dont l'utilisation est de 3,5 millions atteint une capacité de 7 millions).
Lorsque l'utilisation dépasse 5 millions de séries, l'espace de travail ajoute une mémoire tampon de 10 millions (par exemple, un espace de travail dont l'utilisation est de 25 millions obtient une capacité de 35 millions).

Amazon Managed Service for Prometheus alloue automatiquement une plus grande capacité à mesure que votre ingestion augmente, dans la limite de votre quota. Cela permet de garantir que votre charge de travail ne soit pas ralentie de manière prolongée. Toutefois, un ralentissement peut se produire si vous doublez ou dépassez 10 millions de dollars par rapport à la valeur de référence précédente calculée au cours des 30 dernières minutes. Pour éviter tout ralentissement, Amazon Managed Service for Prometheus recommande d'augmenter progressivement l'ingestion lorsque vous dépassez votre niveau de référence précédent.

Note

La capacité minimale pour les séries chronologiques actives est de 2 millions, et il n'y a pas de limitation lorsque vous en avez moins de 2 millions.

Pour dépasser votre quota par défaut, vous pouvez demander une augmentation de quota.

Dépasser le quota par défaut

Lorsque vous demandez une augmentation de quota supérieure au quota de séries actives par défaut, Amazon Managed Service for Prometheus ajuste la capacité de votre espace de travail en conséquence. Si vous n'utilisez pas pleinement la capacité accrue, le service récupérera la partie inutilisée au fil du temps. Au fur et à mesure que votre utilisation augmente, l'espace de travail s'agrandira automatiquement.

Toutefois, la régulation peut se produire si vous doublez ou dépassez 50 millions de séries chronologiques actives par rapport à votre base de référence précédente calculée au cours des 2 dernières heures. Par exemple :

Si votre quota est de 100 millions et que votre base de référence est de 30 millions, vous pouvez passer à 60 millions en 2 heures sans limitation.
Si votre quota est de 100 millions et que votre base de référence est de 50 millions, vous pouvez passer aux 100 millions en 2 heures sans limitation.

Régulation de l'ingestion

Amazon Managed Service for Prometheus limite l'ingestion pour chaque espace de travail, en fonction de vos limites actuelles. Cela permet de maintenir les performances de l'espace de travail. Si vous dépassez la limite, vous le verrez DiscardedSamples dans CloudWatch les statistiques (avec la rate_limited raison). Vous pouvez l'utiliser CloudWatch pour surveiller votre ingestion et créer une alarme pour vous avertir lorsque vous êtes sur le point d'atteindre les limites d'étranglement. Pour de plus amples informations, veuillez consulter Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus.

Amazon Managed Service for Prometheus utilise l'algorithme Token Bucket pour implémenter la régulation de l'ingestion. Avec cet algorithme, votre compte dispose d'un compartiment contenant un nombre spécifique de jetons. Le nombre de jetons contenus dans le bucket représente votre limite d'ingestion à chaque seconde.

Chaque échantillon de données ingéré supprime un jeton du compartiment. Si la taille de votre bucket (taux d'ingestion par espace de travail) est de 1 000 000, votre espace de travail peut ingérer un million d'échantillons de données en une seconde. S'il dépasse un million d'échantillons à ingérer, il sera limité et aucun autre enregistrement ne sera ingéré. Les échantillons de données supplémentaires seront supprimés.

Le seau se recharge automatiquement à un débit défini. Si le compartiment est inférieur à sa capacité maximale, un nombre défini de jetons y est ajouté chaque seconde jusqu'à ce qu'il atteigne sa capacité maximale. Si le seau est plein à l'arrivée des jetons de recharge, ils sont jetés. Le bucket ne peut pas contenir plus de jetons que son maximum. Le taux de recharge pour l'ingestion des échantillons est défini par la limite du taux d'ingestion par espace de travail. Si votre taux d'ingestion par espace de travail est fixé à 170 000, le taux de recharge du bucket est de 170 000 jetons par seconde.

Si votre espace de travail ingère 1 000 000 d'échantillons de données par seconde, votre bucket est immédiatement réduit à zéro jeton. Le seau est ensuite rempli de 170 000 jetons par seconde, jusqu'à ce qu'il atteigne sa capacité maximale de 1 000 000 de jetons. S'il n'y a plus d'ingestion, le seau précédemment vide retrouvera sa capacité maximale en 6 secondes.

Note

L'ingestion se produit dans le cadre de demandes groupées. Si vous avez 100 jetons disponibles et que vous envoyez une demande contenant 101 échantillons, l'intégralité de la demande est rejetée. Amazon Managed Service for Prometheus n'accepte pas partiellement les demandes. Si vous rédigez un collecteur, vous pouvez gérer les nouvelles tentatives (avec des lots plus petits ou après un certain temps écoulé).

Il n'est pas nécessaire d'attendre que le compartiment soit plein pour que votre espace de travail puisse ingérer d'autres échantillons de données. Vous pouvez utiliser des jetons au fur et à mesure qu'ils sont ajoutés au bucket. Si vous utilisez immédiatement les jetons de recharge, le seau n'atteint pas sa capacité maximale. Par exemple, si vous épuisez le compartiment, vous pouvez continuer à ingérer 170 000 échantillons de données par seconde. Le seau ne peut être rempli à sa capacité maximale que si vous ingérez moins de 170 000 échantillons de données par seconde.

Limites supplémentaires relatives aux données ingérées

Amazon Managed Service for Prometheus impose également les exigences supplémentaires suivantes pour les données ingérées dans l’espace de travail. Ces exigences ne sont pas ajustables.

L’ingestion d’échantillons de métriques datant de plus d’une heure est refusée.
Chaque échantillon et chaque métadonnée doivent avoir un nom de métrique.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Suppression d’une balise d’un espace de noms de groupes de règles

Référence d’API