Service Quotas d’Amazon Managed Service for Prometheus - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Service Quotas d’Amazon Managed Service for Prometheus

Les deux sections suivantes décrivent les quotas et limites associés à Amazon Managed Service for Prometheus.

Quotas de service

Amazon Managed Service for Prometheus comporte les quotas suivants. Amazon Managed Service for Prometheus fournit des statistiques d'utilisation pour surveiller l'CloudWatch utilisation des ressources de Prometheus. À l'aide de la fonction d'alarme des métriques d' CloudWatch utilisation d'Amazon, vous pouvez surveiller les ressources et l'utilisation de Prometheus afin d'éviter les erreurs de limite.

Au fur et à mesure que vos projets et espaces de travail se développent, les quotas les plus courants que vous devez surveiller ou pour lesquels vous devez demander une augmentation sont les suivants : séries actives par espace de travail et taux d'ingestion par espace de travail.

Pour tous les quotas ajustables, vous pouvez demander une augmentation de quota en cliquant sur le lien dans la colonne Réglable ou en demandant une augmentation de quota.

La limite de séries actives par espace de travail s’applique dynamiquement. Pour de plus amples informations, veuillez consulter Quotas par défaut des séries actives. Le taux d'ingestion par quota d'espace de travail détermine la rapidité avec laquelle vous pouvez ingérer des données dans votre espace de travail. Pour de plus amples informations, veuillez consulter Régulation de l'ingestion.

Note

Sauf indication contraire, ces quotas s’entendent par espace de travail. La valeur maximale des séries actives par espace de travail est d'un milliard.

Nom Par défaut Ajustable Description
Métriques actives avec métadonnées par espace de travail Chaque Région prise en charge : 20 000 Non Nombre de métriques actives uniques avec métadonnées par espace de travail. Remarque : Si la limite est atteinte, l'échantillon métrique est enregistré, mais les métadonnées dépassant cette limite sont supprimées.
Séries actives par espace de travail Chaque Région prise en charge : 50 000 000 Oui Le nombre de séries actives uniques par espace de travail (jusqu'à un milliard au maximum). Une série est active si un échantillon a été signalé au cours des 2 dernières heures. La capacité de 2 M à 50 M est automatiquement ajustée en fonction des 30 dernières minutes d'utilisation.
Taille du groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes Chaque Région prise en charge : 1 000 Oui Taille maximale d’un groupe d’agrégation d’alertes dans le fichier de définition du gestionnaire d’alertes. Chaque combinaison de valeurs d’étiquette group_by crée un groupe d’agrégation.
Taille du fichier de définition du gestionnaire d’alertes Chaque région prise en charge : 1 000 000 Non Taille maximale d'un fichier de définition du gestionnaire d'alertes, en octets.
Taille de la charge utile des alertes dans Alert Manager Chaque Région prise en charge : 20 Non La taille maximale de la charge utile de toutes les alertes Alert Manager par espace de travail, en mégaoctets. La taille de l’alerte dépend des étiquettes et des annotations.
Alertes dans le gestionnaire d'alertes Chaque Région prise en charge : 1 000 Oui Nombre maximal d'alertes Alert Manager simultanées par espace de travail.
Clusters de suivi de la haute disponibilité Chaque région prise en charge : 500 Non Nombre maximal de clusters que le dispositif de suivi de la haute disponibilité suivra pour les échantillons ingérés par espace de travail.
Taux d’ingestion par espace de travail Chaque Région prise en charge : 170 000 Oui Taux d’ingestion d’échantillons de métriques par espace de travail et par seconde.
Règles d’inhibition dans le fichier de définition du gestionnaire d’alertes Chaque Région prise en charge : 100 Oui Nombre maximal de règles d’inhibition dans le fichier de définition du gestionnaire d’alertes.
Taille de l’étiquette Chaque région prise en charge : 7 Non Taille combinée maximale de toutes les étiquettes et valeurs d'étiquette acceptées pour une série, en kilo-octets.
LabelSet limites par espace de travail Chaque Région prise en charge : 100 Oui Nombre maximum de limites de jeux d'étiquettes pouvant être créées par espace de travail.
Étiquettes par série de métriques Chaque Région prise en charge : 150 Oui Nombre d’étiquettes par série de métriques.
Longueur des métadonnées Par région prise en charge : 1 Non Longueur maximale acceptée pour les métadonnées métriques, en kilo-octets. Les métadonnées font référence au nom, au type, à l'unité et au texte d'aide de la métrique.
Métadonnées par métrique Chaque Région prise en charge : 10 Non Nombre de métadonnées par métrique. Remarque : Si la limite est atteinte, l'échantillon métrique est enregistré, mais les métadonnées dépassant cette limite sont supprimées.
Nœuds dans l’arborescence de routage du gestionnaire d’alertes Chaque Région prise en charge : 100 Oui Nombre maximal de nœuds dans l’arborescence de routage du gestionnaire d’alertes.
Nombre d'opérations d'API par région en transactions par seconde Par région prise en charge : 10 Oui Le nombre maximum d'opérations d'API par seconde et par région pour tous les Amazon Managed Service for APIs Prometheus, y compris le CRUD de l'espace de travail, le APIs balisage, l'espace de noms des groupes de règles APIs CRUD et le APIs CRUD de définition du gestionnaire d'alertes. APIs
Nombre d' GetSeriesopérations GetLabels et d' GetMetricMetadata API par espace de travail en transactions par seconde Chaque Région prise en charge : 10 Non Le nombre maximum d'opérations d' GetSeriesAPI GetMetricMetadata compatibles avec Prometheus par seconde GetLabels et par espace de travail.
Nombre d'opérations d' QueryMetrics API par espace de travail en transactions par seconde Chaque région prise en charge : 300 Non Le nombre maximum d'opérations d'API QueryMetrics compatibles avec Prometheus par seconde et par espace de travail.
Nombre d'opérations d' RemoteWrite API par espace de travail en transactions par seconde Chaque Région prise en charge : 3 000 Non Le nombre maximum d'opérations d'API RemoteWrite compatibles avec Prometheus par seconde et par espace de travail.
Nombre d'autres opérations d'API compatibles avec Prometheus par espace de travail en transactions par seconde Chaque Région prise en charge : 100 Non Le nombre maximum d'opérations d'API par seconde et par espace de travail pour toutes les autres applications compatibles avec Prometheus, APIs y compris, etc. ListAlerts ListRules
Octets de requête pour les requêtes instantanées Chaque région prise en charge : 5 Non Nombre maximal d'octets pouvant être analysés par une seule requête instantanée, en gigaoctets.
Octets de requête pour les requêtes de plage Chaque région prise en charge : 5 Non Nombre maximal d'octets pouvant être analysés par intervalle de 24 heures dans le cadre d'une requête à plage unique, en gigaoctets.
Exemples de requête Chaque Région prise en charge : 50 000 000 Non Nombre maximal d’échantillons pouvant être analysés au cours d’une seule requête.
Série de requêtes récupérée Chaque Région prise en charge : 12 000 000 Non Nombre maximal de séries pouvant être analysées au cours d’une seule requête.
Plage de temps de requête en jours Chaque région prise en charge : 95 Non La plage de temps maximale de QueryMetrics GetSeries, et GetLabels APIs.
Taille des demandes Par région prise en charge : 1 Non Taille maximale de requête pour l'ingestion ou la requête, en mégaoctets.
Intervalle d’évaluation des règles Chaque Région prise en charge : 30 Oui Intervalle minimal d'évaluation des règles d'un groupe de règles par espace de travail, en secondes.
Taille du fichier de définition de l’espace de noms de groupes de règles Chaque région prise en charge : 1 000 000 Non Taille maximale d'un fichier de définition d'espace de noms de groupe de règles, en octets.
Règles par espace de travail Chaque Région prise en charge : 2 000 Oui Nombre maximal de règles par espace de travail.
Silences par espace de travail Chaque Région prise en charge : 1 000 Oui Nombre maximum de silences, y compris les silences expirés, actifs et en attente, par espace de travail.
Modèles dans le fichier de définition du gestionnaire d’alertes Chaque Région prise en charge : 100 Oui Nombre maximal de modèles dans le fichier de définition du gestionnaire d’alertes.
Espaces de travail par région et par compte Chaque région prise en charge : 25 Oui Nombre maximal d’espaces de travail par région.

Quotas par défaut des séries actives

Les espaces de travail Amazon Managed Service for Prometheus s'adaptent automatiquement à votre consommation d'ingestion. À mesure que votre utilisation augmente, le service augmente automatiquement la capacité de vos séries chronologiques jusqu'au quota par défaut.

Votre espace de travail Amazon Managed Service for Prometheus évolue automatiquement, en fonction de votre utilisation, de deux manières :

  1. Lorsque votre utilisation moyenne sur 30 minutes est inférieure à 5 millions de séries, la capacité double (par exemple, un espace de travail dont l'utilisation est de 3,5 millions atteint une capacité de 7 millions).

  2. Lorsque l'utilisation dépasse 5 millions de séries, l'espace de travail ajoute une mémoire tampon de 10 millions (par exemple, un espace de travail dont l'utilisation est de 25 millions obtient une capacité de 35 millions).

Amazon Managed Service for Prometheus alloue automatiquement une plus grande capacité à mesure que votre ingestion augmente, dans la limite de votre quota. Cela permet de garantir que votre charge de travail ne soit pas ralentie de manière prolongée. Toutefois, un ralentissement peut se produire si vous doublez ou dépassez 10 millions de dollars par rapport à la valeur de référence précédente calculée au cours des 30 dernières minutes. Pour éviter tout ralentissement, Amazon Managed Service for Prometheus recommande d'augmenter progressivement l'ingestion lorsque vous dépassez votre niveau de référence précédent.

Note

La capacité minimale pour les séries chronologiques actives est de 2 millions, et il n'y a pas de limitation lorsque vous en avez moins de 2 millions.

Pour dépasser votre quota par défaut, vous pouvez demander une augmentation de quota.

Dépasser le quota par défaut

Lorsque vous demandez une augmentation de quota supérieure au quota de séries actives par défaut, Amazon Managed Service for Prometheus ajuste la capacité de votre espace de travail en conséquence. Si vous n'utilisez pas pleinement la capacité accrue, le service récupérera la partie inutilisée au fil du temps. Au fur et à mesure que votre utilisation augmente, l'espace de travail s'agrandira automatiquement.

Toutefois, la régulation peut se produire si vous doublez ou dépassez 50 millions de séries chronologiques actives par rapport à votre base de référence précédente calculée au cours des 2 dernières heures. Par exemple :

  • Si votre quota est de 100 millions et que votre base de référence est de 30 millions, vous pouvez passer à 60 millions en 2 heures sans limitation.

  • Si votre quota est de 100 millions et que votre base de référence est de 50 millions, vous pouvez passer aux 100 millions en 2 heures sans limitation.

Régulation de l'ingestion

Amazon Managed Service for Prometheus limite l'ingestion pour chaque espace de travail, en fonction de vos limites actuelles. Cela permet de maintenir les performances de l'espace de travail. Si vous dépassez la limite, vous le verrez DiscardedSamples dans CloudWatch les statistiques (avec la rate_limited raison). Vous pouvez l'utiliser CloudWatch pour surveiller votre ingestion et créer une alarme pour vous avertir lorsque vous êtes sur le point d'atteindre les limites d'étranglement. Pour de plus amples informations, veuillez consulter Utilisez CloudWatch des métriques pour surveiller les ressources Amazon Managed Service for Prometheus.

Amazon Managed Service for Prometheus utilise l'algorithme Token Bucket pour implémenter la régulation de l'ingestion. Avec cet algorithme, votre compte dispose d'un compartiment contenant un nombre spécifique de jetons. Le nombre de jetons contenus dans le bucket représente votre limite d'ingestion à chaque seconde.

Chaque échantillon de données ingéré supprime un jeton du compartiment. Si la taille de votre bucket (taux d'ingestion par espace de travail) est de 1 000 000, votre espace de travail peut ingérer un million d'échantillons de données en une seconde. S'il dépasse un million d'échantillons à ingérer, il sera limité et aucun autre enregistrement ne sera ingéré. Les échantillons de données supplémentaires seront supprimés.

Le seau se recharge automatiquement à un débit défini. Si le compartiment est inférieur à sa capacité maximale, un nombre défini de jetons y est ajouté chaque seconde jusqu'à ce qu'il atteigne sa capacité maximale. Si le seau est plein à l'arrivée des jetons de recharge, ils sont jetés. Le bucket ne peut pas contenir plus de jetons que son maximum. Le taux de recharge pour l'ingestion des échantillons est défini par la limite du taux d'ingestion par espace de travail. Si votre taux d'ingestion par espace de travail est fixé à 170 000, le taux de recharge du bucket est de 170 000 jetons par seconde.

Si votre espace de travail ingère 1 000 000 d'échantillons de données par seconde, votre bucket est immédiatement réduit à zéro jeton. Le seau est ensuite rempli de 170 000 jetons par seconde, jusqu'à ce qu'il atteigne sa capacité maximale de 1 000 000 de jetons. S'il n'y a plus d'ingestion, le seau précédemment vide retrouvera sa capacité maximale en 6 secondes.

Note

L'ingestion se produit dans le cadre de demandes groupées. Si vous avez 100 jetons disponibles et que vous envoyez une demande contenant 101 échantillons, l'intégralité de la demande est rejetée. Amazon Managed Service for Prometheus n'accepte pas partiellement les demandes. Si vous rédigez un collecteur, vous pouvez gérer les nouvelles tentatives (avec des lots plus petits ou après un certain temps écoulé).

Il n'est pas nécessaire d'attendre que le compartiment soit plein pour que votre espace de travail puisse ingérer d'autres échantillons de données. Vous pouvez utiliser des jetons au fur et à mesure qu'ils sont ajoutés au bucket. Si vous utilisez immédiatement les jetons de recharge, le seau n'atteint pas sa capacité maximale. Par exemple, si vous épuisez le compartiment, vous pouvez continuer à ingérer 170 000 échantillons de données par seconde. Le seau ne peut être rempli à sa capacité maximale que si vous ingérez moins de 170 000 échantillons de données par seconde.

Limites supplémentaires relatives aux données ingérées

Amazon Managed Service for Prometheus impose également les exigences supplémentaires suivantes pour les données ingérées dans l’espace de travail. Ces exigences ne sont pas ajustables.

  • L’ingestion d’échantillons de métriques datant de plus d’une heure est refusée.

  • Chaque échantillon et chaque métadonnée doivent avoir un nom de métrique.