Service Quotas do Amazon Managed Service for Prometheus - Amazon Managed Service for Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Service Quotas do Amazon Managed Service for Prometheus

As duas seções a seguir descrevem as cotas e os limites associados ao Amazon Managed Service for Prometheus.

Cotas de serviço

O Amazon Managed Service for Prometheus tem as cotas a seguir. O Amazon Managed Service for Prometheus vende métricas de uso para monitorar o CloudWatch uso dos recursos do Prometheus. Usando o recurso de alarme CloudWatch de métricas de uso da Amazon, você pode monitorar os recursos e o uso do Prometheus para evitar erros de limite.

À medida que seus projetos e espaços de trabalho crescem, as cotas mais comuns que você deve monitorar ou solicitar um aumento são: séries ativas por espaço de trabalho e Taxa de ingestão por espaço de trabalho.

Para todas as cotas ajustáveis, você pode solicitar um aumento de cota escolhendo o link na coluna Ajustável ou solicitando um aumento de cota.

O limite da série ativa por espaço de trabalho é aplicado dinamicamente. Para obter mais informações, consulte Cotas padrão da série ativa. A taxa de ingestão por cota de espaço de trabalho determina a rapidez com que você pode ingerir dados em seu espaço de trabalho. Para obter mais informações, consulte Controle de utilização da ingestão.

nota

Salvo indicação em contrário, essas cotas são por espaço de trabalho. O valor máximo para séries ativas por espaço de trabalho é de um bilhão.

Name Padrão Ajustável Descrição
Métricas ativas com metadados por espaço de trabalho Cada região com suporte: 20.000 Não O número de métricas ativas exclusivas com metadados por espaço de trabalho. Observação: se o limite for atingido, a amostra da métrica será registrada, mas os metadados acima do limite serão descartados.
Série ativa por espaço de trabalho Cada região com suporte: 50.000.000 Sim O número de séries ativas exclusivas por espaço de trabalho (até um máximo de 1 bilhão). Uma série está ativa se uma amostra tiver sido relatada nas últimas 2 horas. A capacidade de 2 M a 50 M é ajustada automaticamente com base nos últimos 30 minutos de uso.
Tamanho do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas Cada região com suporte: 1.000 Sim Tamanho máximo do grupo de agregação de alertas no arquivo de definição do gerenciador de alertas. Cada combinação de valores de rótulo de group_by cria um grupo de agregação.
Tamanho do arquivo de definição do gerenciador de alertas Cada região com suporte: 1.000.000 Não O tamanho máximo de um arquivo de definição do gerenciador de alertas, em bytes.
Tamanho da carga útil do alerta no gerenciador de alertas Cada região compatível: 20 Não O tamanho máximo da carga útil de todos os alertas do Alert Manager por espaço de trabalho, em megabytes. O tamanho do alerta depende dos rótulos e das anotações.
Alertas no gerenciador de alertas Cada região com suporte: 1.000 Sim O número máximo de alertas simultâneos do gerenciador de alertas por espaço de trabalho.
Clusters de rastreadores HA Cada região com suporte: 500 Não O número máximo de clusters que o rastreador HA rastreará para amostras ingeridas por espaço de trabalho.
Taxa de ingestão por espaço de trabalho Cada região com suporte: 170.000 Sim Taxa métrica de ingestão de amostras por espaço de trabalho por segundo.
Regras de inibição no arquivo de definição do gerenciador de alertas Cada região com suporte: 100 Sim Número máximo de regras de inibição no arquivo de definição do gerenciador de alertas.
Tamanho do label Cada região compatível: 7 Não O tamanho máximo combinado de todos os rótulos e valores de rótulos aceitos para uma série, em kilobytes.
LabelSet limites por espaço de trabalho Cada região compatível: 100 Sim O número máximo de limites de conjuntos de etiquetas que podem ser criados por espaço de trabalho.
Rótulos por série métrica Cada região com suporte: 150 Sim Número de rótulos por série métrica.
Tamanho dos metadados Cada região compatível: 1 Não O tamanho máximo aceito para metadados métricos, em kilobytes. Os metadados são referentes a nome da métrica, tipo, unidade e texto de ajuda.
Metadados por métrica Cada região com suporte: 10 Não O número de metadados por métrica. Observação: se o limite for atingido, a amostra da métrica será registrada, mas os metadados acima do limite serão descartados.
Nós na árvore de roteamento do gerenciador de alertas Cada região com suporte: 100 Sim O número máximo de nós na árvore de roteamento do gerenciador de alertas.
Número de operações de API por região em transações por segundo Cada região com suporte: 10 Sim O número máximo de operações de API por segundo por região para todo o Amazon Managed Service for APIs Prometheus, incluindo CRUD do espaço de trabalho, APIs marcação, CRUD do namespace APIs dos grupos de regras e APIs CRUD de definição do gerenciador de alertas. APIs
Número GetLabels e operações GetSeries de GetMetricMetadata API por espaço de trabalho em transações por segundo Cada região com suporte: 10 Não O número máximo de operações de GetSeries API GetMetricMetadata compatíveis com o Prometheus por segundo por espaço de trabalho. GetLabels
Número de operações de QueryMetrics API por espaço de trabalho em transações por segundo Cada região com suporte: 300 Não O número máximo de operações de API QueryMetrics compatíveis com o Prometheus por segundo por espaço de trabalho.
Número de operações de RemoteWrite API por espaço de trabalho em transações por segundo Cada região com suporte: 3.000 Não O número máximo de operações de API RemoteWrite compatíveis com o Prometheus por segundo por espaço de trabalho.
O número de outras operações de API compatíveis com o Prometheus por espaço de trabalho em transações por segundo Cada região compatível: 100 Não O número máximo de operações de API por segundo por espaço de trabalho para todos os outros compatíveis com o Prometheus APIs , incluindo, ListAlerts etc. ListRules
Bytes de consulta para consultas instantâneas Cada região compatível: 5 Não O máximo de bytes que podem ser verificados por uma única consulta instantânea, em gigabytes.
Bytes de consulta para consultas de intervalo Cada região compatível: 5 Não O máximo de bytes que podem ser verificados por intervalo de 24 horas em uma consulta de intervalo único, em gigabytes.
Consultas de exemplo Cada região com suporte: 50.000.000 Não O número máximo de blocos que podem ser escaneados durante uma única consulta.
Série de consultas obtida Cada região com suporte: 12.000.000 Não O número máximo de séries que podem ser escaneadas durante uma única consulta.
Intervalo de tempo de consulta em dias Cada região suportada: 95 Não O intervalo máximo de tempo de QueryMetrics GetSeries, GetLabels APIs e.
Dimensão da solicitação Cada região compatível: 1 Não O tamanho máximo da solicitação para ingestão ou consulta, em megabytes.
Intervalo de avaliação da regra Cada região compatível: 30 Sim O intervalo mínimo de avaliação de regras de um grupo de regras por espaço de trabalho, em segundos.
Tamanho do arquivo de definição do namespace do grupo de regras Cada região com suporte: 1.000.000 Não O tamanho máximo de um arquivo de definição de namespace de grupo de regras, em bytes.
Regras por espaço de trabalho Cada região com suporte: 2.000 Sim O número máximo de regras por WorkSpace.
Silêncios por espaço de trabalho Cada região com suporte: 1.000 Sim Número máximo de silêncios, incluindo silêncios expirados, ativos e pendentes, por espaço de trabalho.
Modelos no arquivo de definição do gerenciador de alertas Cada região com suporte: 100 Sim O número máximo de modelos no arquivo de definição do gerenciador de alertas.
Espaços de trabalho por região por conta Cada região com suporte: 25 Sim O número máximo de tags por espaços de trabalho.

Cotas padrão da série ativa

Os espaços de trabalho do Amazon Managed Service para Prometheus se adaptam automaticamente ao seu uso de ingestão. Conforme seu uso aumenta, o serviço aumenta automaticamente sua capacidade de séries temporais até a cota padrão.

Seu espaço de trabalho do Amazon Managed Service for Prometheus é escalado automaticamente, com base no seu uso, de duas maneiras:

  1. Quando seu uso médio de 30 minutos está abaixo de 5 milhões de séries, a capacidade dobra (por exemplo, um espaço de trabalho com 3,5 milhões de uso obtém 7 milhões de capacidade).

  2. Quando o uso excede 5 milhões de séries, o espaço de trabalho adiciona um buffer de 10 milhões (por exemplo, um espaço de trabalho com 25 milhões de uso obtém 35 milhões de capacidade).

O Amazon Managed Service for Prometheus aloca automaticamente mais capacidade à medida que sua ingestão aumenta, até sua cota. Isso ajuda a garantir que sua carga de trabalho não sofra limitação contínua. No entanto, a limitação pode ocorrer se você dobrar ou exceder 10 milhões acima da linha de base anterior calculada nos últimos 30 minutos. Para evitar a limitação, o Amazon Managed Service for Prometheus recomenda aumentar gradualmente a ingestão ao aumentar além da linha de base anterior.

nota

A capacidade mínima para séries temporais ativas é de 2 milhões, e não há limitação quando você tem menos de 2 milhões de séries.

Para ir além da cota padrão, você pode solicitar um aumento de cota.

Escalonamento acima da cota padrão

Quando você solicita um aumento de cota acima da cota padrão da série ativa, o Amazon Managed Service for Prometheus ajusta a capacidade do seu espaço de trabalho adequadamente. Se você não utilizar totalmente a capacidade aumentada, o serviço recuperará a parte não utilizada ao longo do tempo. À medida que seu uso aumenta, o espaço de trabalho será ampliado novamente automaticamente.

No entanto, a limitação pode ocorrer se você mais do que dobrar ou exceder 50 milhões de séries temporais ativas em relação à linha de base anterior, calculada nas últimas 2 horas. Por exemplo:

  • Se sua cota for de 100 milhões e sua linha de base for de 30 milhões, você poderá escalar até 60 milhões em 2 horas sem limitação.

  • Se sua cota for de 100 milhões e sua linha de base for de 50 milhões, você poderá escalar até o total de 100 milhões em 2 horas sem limitação.

Controle de utilização da ingestão

O Amazon Managed Service for Prometheus tem controle de utilização da ingestão em cada espaço de trabalho, com base nos seus limites atuais. Isso ajuda a manter o desempenho dos espaços de trabalho. Se você exceder o limite, você verá DiscardedSamples nas CloudWatch métricas (com o rate_limited motivo). Você pode usar CloudWatch para monitorar sua ingestão e criar um alarme para avisá-lo quando estiver perto de atingir os limites de limitação. Para obter mais informações, consulte Use CloudWatch métricas para monitorar os recursos do Amazon Managed Service for Prometheus.

O Amazon Managed Service for Prometheus usa o algoritmo do bucket de tokens para implementar o controle de utilização da ingestão. Com esse algoritmo, sua conta tem um bucket que contém um número específico de tokens. O número de tokens no bucket representa seu limite de ingestão em qualquer segundo.

Cada amostra de dados ingerida remove um token do bucket. Se o tamanho do seu bucket (taxa de ingestão por espaço de trabalho) for 1.000.000, seu espaço de trabalho poderá ingerir um milhão de amostras de dados em um segundo. Se ele exceder um milhão de amostras para ingestão, o controle de utilização será aplicado e nenhum outro registro será ingerido. As amostras de dados adicionais serão descartadas.

O bucket será recarregado automaticamente a uma taxa definida. Se o bucket ficar abaixo da capacidade máxima, um determinado número de tokens será adicionado novamente a ele a cada segundo até atingir sua capacidade máxima. Se o bucket estiver cheio quando os tokens de recarga forem adicionados, eles serão descartados. O bucket não pode conter mais do que seu número máximo de tokens. A taxa de recarga para amostras de ingestão é definida pelo limite da taxa de ingestão por espaço de trabalho. Se sua taxa de ingestão por espaço de trabalho estiver definida como 170.000, a taxa de recarga do bucket será de 170.000 tokens por segundo.

Se seu espaço de trabalho ingerir 1.000.000 de amostras de dados por segundo, seu bucket será imediatamente reduzido para zero token. O bucket será então recarregado com 170.000 tokens a cada segundo até atingir sua capacidade máxima de 1.000.000 tokens. Se não houver mais ingestão, o bucket anteriormente vazio retornará à sua capacidade máxima em 6 segundos.

nota

A ingestão ocorre via solicitações em lote. Se você tiver 100 tokens disponíveis e enviar uma solicitação com 101 amostras, a solicitação inteira será rejeitada. O Amazon Managed Service for Prometheus não aceita solicitações parcialmente. Se você estiver gravando um coletor, poderá gerenciar novas tentativas (com lotes menores ou após algum tempo).

Para que o bucket possa ingerir mais amostras de dados, você não precisa esperar que o bucket esteja cheio. Você pode usar tokens à medida que eles são adicionados ao bucket. Se você usar imediatamente os tokens de recarga, o bucket não atingirá sua capacidade máxima. Por exemplo, se você esgotar o bucket, poderá continuar ingerindo 170.000 amostras de dados por segundo. O bucket poderá ser recarregado até a capacidade máxima somente se você ingerir menos de 170.000 amostras de dados por segundo.

Limites adicionais para dados ingeridos

O Amazon Managed Service for Prometheus também tem os seguintes requisitos adicionais para ingestão de dados no espaço de trabalho. Eles não são ajustáveis.

  • Amostras métricas com mais de 1 hora não podem ser ingeridas.

  • Cada amostra e metadado deve ter um nome de métrica.