Cuotas de servicio de Amazon Managed Service para Prometheus - Servicio administrado por Amazon para Prometheus

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cuotas de servicio de Amazon Managed Service para Prometheus

En las dos secciones siguientes se describen las cuotas y los límites asociados a Amazon Managed Service para Prometheus.

Service Quotas

Amazon Managed Service para Prometheus tiene las siguientes cuotas. Amazon Managed Service for Prometheus ofrece métricas de uso para supervisar el uso de CloudWatch los recursos de Prometheus. Con la función de alarma CloudWatch de métricas de uso de Amazon, puede supervisar los recursos y el uso de Prometheus para evitar errores de límite.

A medida que sus proyectos y espacios de trabajo crecen, las cuotas más habituales que puede necesitar supervisar o para las que puede necesitar solicitar un aumento son: las series activas por espacio de trabajo, la tasa de ingesta por espacio de trabajo y el tamaño de la ráfaga de ingesta por espacio de trabajo.

Para todas las cuotas ajustables, puede solicitar un aumento de cuota seleccionando el enlace de la columna Ajustable o solicitando un aumento de cuota.

El límite de series activas por espacio de trabajo se aplica de forma dinámica. Para obtener más información, consulte Cuotas predeterminadas de las series activas. La tasa de ingesta por espacio de trabajo y el tamaño de ampliación de ingesta por espacio de trabajo controlan, en conjunto, la rapidez con la que se pueden introducir datos en el espacio de trabajo. Para obtener más información, consulte Limitación de la ingesta.

nota

A menos que se indique lo contrario, estas cuotas son por espacio de trabajo. El valor máximo de las series activas por espacio de trabajo es de mil millones.

Nombre Valor predeterminado Ajustable Descripción
Métricas activas con metadatos por espacio de trabajo Cada región admitida: 20 000 No El número de métricas activas únicas con metadatos por espacio de trabajo. Nota: Si se alcanza el límite, se registra una muestra de métrica, pero se eliminan los metadatos que superen el límite.
Series activas por espacio de trabajo Cada región admitida: 50 000 000 El número de series activas únicas por espacio de trabajo (hasta un máximo de mil millones). Una serie está activa si se ha registrado una muestra en las últimas 2 horas. La capacidad de 2 a 50 M se ajusta automáticamente en función de los últimos 30 minutos de uso.
Tamaño del grupo de agregación de alertas en el archivo de definición del administrador de alertas Cada región admitida: 1000 El tamaño máximo de un grupo de agregación de alertas en el archivo de definición del administrador de alertas. Cada combinación de valores de etiqueta de group_by crearía un grupo de agregación.
Tamaño del archivo de definición del administrador de alertas Cada región admitida: 1 No El tamaño máximo de un archivo de definición del gestor de alertas, en megabytes.
Tamaño de la carga útil de alertas en el administrador de alertas Cada región admitida: 20 No El tamaño máximo de carga útil de todas las alertas de Alert Manager por espacio de trabajo, en megabytes. El tamaño de las alertas depende de las etiquetas y las anotaciones.
Alertas en el administrador de alertas Cada región admitida: 1000 Número máximo de alertas de administrador de alertas simultáneas por espacio de trabajo.
Clústeres del rastreador de alta disponibilidad Cada región admitida: 500 No El número máximo de clústeres de los que el rastreador de alta disponibilidad realizará un seguimiento para las muestras ingeridas por espacio de trabajo.
Tasa de ingesta por espacio de trabajo Cada región admitida: 170 000 Tasa de ingesta de muestras de métricas por espacio de trabajo y por segundo.
Reglas de inhibición en el archivo de definición del administrador de alertas Cada región admitida: 100 El número máximo de reglas de inhibición en el archivo de definición del administrador de alertas.
Tamaño de etiqueta Cada región admitida: 7 No El tamaño máximo combinado de todas las etiquetas y valores de etiqueta aceptados para una serie, en kilobytes.
LabelSet límites por espacio de trabajo Cada región admitida: 100 El número máximo de límites de conjuntos de etiquetas que se pueden crear por espacio de trabajo.
Etiquetas por serie de métricas Cada región admitida: 150 Número de etiquetas por serie de métricas.
Longitud de los metadatos Cada región admitida: 1 No La longitud máxima aceptada para los metadatos métricos, en kilobytes. Los metadatos hacen referencia al nombre de métrica, el tipo, la unidad y el texto de ayuda.
Metadatos por métrica Cada región admitida: 10 No El número de metadatos por métrica. Nota: Si se alcanza el límite, se registra una muestra de métrica, pero se eliminan los metadatos que superen el límite.
Nodos del árbol de enrutamiento del administrador de alertas Cada región admitida: 100 El número máximo de nodos del árbol de enrutamiento del administrador de alertas.
Número de operaciones de la API por región en transacciones por segundo Cada región admitida: 10 El número máximo de operaciones de API por segundo por región para todos los Amazon Managed Service for APIs Prometheus, incluidos el CRUD del espacio de trabajo, el APIs etiquetado, el APIs CRUD del espacio de nombres APIs de los grupos de reglas y el CRUD definido por el administrador de alertas. APIs
Número y operaciones de API por espacio de GetSeries trabajo en transacciones GetLabels por segundo GetMetricMetadata Cada región admitida: 10 No El número máximo de operaciones de GetSeries API GetMetricMetadata compatibles con Prometheus por segundo por espacio de trabajo. GetLabels
Número de operaciones de QueryMetrics API por espacio de trabajo en transacciones por segundo Cada región admitida: 300 No El número máximo de operaciones de API QueryMetrics compatibles con Prometheus por segundo por espacio de trabajo.
Número de operaciones de RemoteWrite API por espacio de trabajo en transacciones por segundo Cada región admitida: 3000 No El número máximo de operaciones de API RemoteWrite compatibles con Prometheus por segundo por espacio de trabajo.
Número de otras operaciones de API compatibles con Prometheus por espacio de trabajo en transacciones por segundo Cada región admitida: 100 No El número máximo de operaciones de API por segundo por espacio de trabajo para todos los demás dispositivos compatibles con Prometheus ListAlerts, APIs incluidos, etc. ListRules
Bytes de consulta para consultas instantáneas Cada región admitida: 5 No El número máximo de bytes que puede escanear una sola consulta instantánea, en gigabytes.
Bytes de consulta para consultas de intervalo Cada región admitida: 5 No Número máximo de bytes que se pueden escanear por intervalo de 24 horas en una consulta de rango único, en gigabytes.
Ejemplos de consulta Cada región admitida: 50 000 000 No El número máximo de muestras que pueden escanearse durante una sola consulta.
Series de consultas recuperadas Cada región admitida: 12 000 000 No El número máximo de series que pueden escanearse durante una sola consulta.
Intervalo de tiempo de consulta en días Cada región compatible: 95 No El intervalo de tiempo máximo de QueryMetrics GetSeries, y GetLabels APIs.
Solicitar tamaño Cada región admitida: 1 No El tamaño máximo de la solicitud de ingesta o consulta, en megabytes.
Intervalo de evaluación de la regla Cada región admitida: 30 El intervalo mínimo de evaluación de reglas de un grupo de reglas por espacio de trabajo, en segundos.
Tamaño del archivo de definición de un espacio de nombres de grupos de reglas Cada región admitida: 1 No El tamaño máximo de un archivo de definición de espacio de nombres de grupos de reglas, en megabytes.
Reglas por espacio de trabajo Cada región admitida: 2000 El número máximo de etiquetas por espacio de trabajo.
Silencios por espacio de trabajo Cada región admitida: 1000 Número máximo de silencios, incluidos los caducados, activos y pendientes, por espacio de trabajo.
Plantillas en el archivo de definición del administrador de alertas Cada región admitida: 100 El número máximo de plantillas del archivo de definición del administrador de alertas.
Espacios de trabajo por región y por cuenta Cada región admitida: 25 El número máximo de espacios de trabajo por región.

Cuotas predeterminadas de las series activas

Los espacios de trabajo de Amazon Managed Service for Prometheus se adaptan automáticamente a tu uso de ingestión. A medida que aumenta el uso, el servicio aumenta automáticamente la capacidad de las series temporales hasta alcanzar la cuota predeterminada.

Su espacio de trabajo de Amazon Managed Service for Prometheus se amplía automáticamente, en función del uso, de dos maneras:

  1. Cuando el uso medio de 30 minutos es inferior a 5 millones de la serie, la capacidad se duplica (por ejemplo, un espacio de trabajo con un uso de 3,5 millones pasa a tener una capacidad de 7 millones).

  2. Cuando el uso supera los 5 millones de series, el espacio de trabajo añade 10 millones de búferes (por ejemplo, un espacio de trabajo con un uso de 25 millones obtiene una capacidad de 35 millones).

Amazon Managed Service for Prometheus asigna automáticamente más capacidad a medida que aumenta tu consumo, hasta alcanzar tu cuota. Esto ayuda a garantizar que su carga de trabajo no sufra una reducción constante. Sin embargo, puede producirse una reducción si se duplica o supera en 10 millones la cifra de referencia anterior calculada en los últimos 30 minutos. Para evitar las limitaciones, Amazon Managed Service for Prometheus recomienda aumentar gradualmente la ingesta cuando se supere el nivel de referencia anterior.

nota

La capacidad mínima para las series temporales activas es de 2 millones, y no hay límite cuando se tienen menos de 2 millones de series.

Para superar tu cuota predeterminada, puedes solicitar un aumento de la cuota.

Escalar por encima de la cuota predeterminada

Cuando solicitas un aumento de cuota por encima de la cuota de series activas predeterminada, Amazon Managed Service for Prometheus ajusta la capacidad de tu espacio de trabajo en consecuencia. Si no utilizas al máximo la capacidad aumentada, el servicio recuperará la parte no utilizada con el tiempo. A medida que aumente el uso, el espacio de trabajo volverá a ampliarse automáticamente.

Sin embargo, puede producirse una limitación si se duplican o superan los 50 millones de series temporales activas respecto a la línea base anterior calculada a partir de las últimas 2 horas. Por ejemplo:

  • Si tu cuota es de 100 millones y tu base de referencia es de 30 millones, puedes ampliarla hasta 60 millones en 2 horas sin restricciones.

  • Si tu cuota es de 100 millones y tu base de referencia es de 50 millones, puedes ampliarla hasta los 100 millones completos en 2 horas sin restricciones.

Limitación de la ingesta

Amazon Managed Service para Prometheus limita la ingesta de cada espacio de trabajo en función de los límites actuales. Esto lo ayuda a mantener el rendimiento del espacio de trabajo. Si superas el límite, lo verás DiscardedSamples en CloudWatch las métricas (con el rate_limited motivo). Puedes utilizarlas CloudWatch para monitorizar tu ingesta y crear una alarma que te avise cuando estés a punto de alcanzar los límites máximos. Para obtener más información, consulte Usa CloudWatch métricas para monitorear los recursos de Amazon Managed Service for Prometheus.

Amazon Managed Service para Prometheus utiliza el algoritmo de bucket de tokens para implementar la limitación de la ingesta. Con este algoritmo, su cuenta tiene un bucket que contiene un número específico de tokens. El número de tokens del bucket representa el límite de ingesta en un segundo determinado.

Cada muestra de datos ingerida quita un token del bucket. Si el tamaño del bucket (Tamaño de ampliación de la ingesta por espacio de trabajo) es de 1 000 000, el espacio de trabajo puede ingerir un millón de muestras de datos en un segundo. Si se supera el millón de muestras en la ingesta, se limitará y no se ingerirán más registros. Las muestras de datos adicionales se descartarán.

El bucket se rellena de forma automática a una tasa fija. Si el bucket está por debajo de la capacidad máxima, se vuelve a agregar un número determinado de tokens cada segundo hasta que alcanza la capacidad máxima. Si el bucket está lleno cuando llegan los tokens de relleno, se descartan. El bucket no puede contener más del número máximo de tokens. La velocidad de relleno para la ingesta de muestras se establece según el límite de la tasa de ingesta por espacio de trabajo. Si la tasa de ingesta por espacio de trabajo está establecida a 170 000, la tasa de relleno del bucket de 170 000 tokens por segundo.

Si el espacio de trabajo ingiere más de 1 000 000 de muestras de datos en un segundo, el bucket se reduce inmediatamente a cero tokens. A continuación, el bucket se rellena con hasta 170 000 tokens por segundo hasta alcanzar la capacidad máxima de 1 000 000 de tokens. Si no se ingiere más, el bucket previamente vacío volverá a la capacidad máxima en seis segundos.

nota

La ingesta se produce en solicitudes por lotes. Si tiene 100 tokens disponibles y envía una solicitud con 101 muestras, se rechazará toda la solicitud. Amazon Managed Service para Prometheus no acepta solicitudes de forma parcial. Si está escribiendo un recopilador, puede administrar los reintentos (con lotes más pequeños o una vez transcurrido un tiempo).

No tiene que esperar a que el bucket esté lleno para que el espacio de trabajo pueda ingerir más muestras de datos. Puede usar los tokens a medida que se vayan agregando al bucket. Si utiliza inmediatamente los tokens de relleno, el bucket no alcanza la capacidad máxima. Por ejemplo, si agota el bucket, puede seguir ingiriendo 170 000 muestras de datos por segundo. El bucket puede rellenarse hasta la capacidad máxima solo si se ingieren menos de 170 000 muestras de datos por segundo.

Límites adicionales para los datos ingeridos

Amazon Managed Service para Prometheus también tiene los siguientes requisitos adicionales para los datos ingeridos en el espacio de trabajo. Estos requisitos no son ajustables.

  • No se permite la ingesta de muestras de métricas de más de 1 hora.

  • Cada muestra y cada metadato deben tener un nombre de métrica.