Cuotas de servicio Cuotas de series activas predeterminadas Escalado por encima de la cuota predeterminada Limitación de la ingesta Límites adicionales para los datos ingeridos

Cuotas de servicio de Amazon Managed Service para Prometheus

En las dos secciones siguientes se describen las cuotas y los límites asociados a Amazon Managed Service para Prometheus.

Cuotas de servicio

Amazon Managed Service para Prometheus tiene las siguientes cuotas. Amazon Managed Service for Prometheus ofrece métricas de uso para supervisar el uso de CloudWatch los recursos de Prometheus. Con la función de alarma CloudWatch de métricas de uso de Amazon, puede supervisar los recursos y el uso de Prometheus para evitar errores de límite.

A medida que sus proyectos y espacios de trabajo crecen, las cuotas más habituales que puede necesitar supervisar o solicitar un aumento son: Series activas por espacio de trabajo y Tasa de ingesta por espacio de trabajo.

Para todas las cuotas ajustables, puede solicitar un aumento de cuota seleccionando el enlace de la columna Ajustable o solicitando un aumento de cuota.

El límite de series activas por espacio de trabajo se aplica de forma dinámica. Para obtener más información, consulte Cuotas de series activas predeterminadas. La Tasa de ingesta por espacio de trabajo determina la rapidez con la que se pueden introducir datos en el espacio de trabajo. Para obtener más información, consulte Limitación de la ingesta.

nota

A menos que se indique lo contrario, estas cuotas son por espacio de trabajo. El valor máximo de las series activas por espacio de trabajo es de mil millones.

Name	Predeterminado	Ajustable	Description (Descripción)
Métricas activas con metadatos por espacio de trabajo	Cada región admitida: 20 000	No	El número de métricas activas únicas con metadatos por espacio de trabajo. Nota: Si se alcanza el límite, se registra una muestra de métrica, pero se eliminan los metadatos que superen el límite.
Series activas por espacio de trabajo	Cada región admitida: 50 000 000	Sí	El número de series activas únicas por espacio de trabajo (hasta un máximo de mil millones). Una serie está activa si se ha registrado una muestra en las últimas 2 horas. La capacidad de 2 a 50 M se ajusta automáticamente en función de los últimos 30 minutos de uso.
Tamaño del grupo de agregación de alertas en el archivo de definición del administrador de alertas	Cada región admitida: 1000	Sí	El tamaño máximo de un grupo de agregación de alertas en el archivo de definición del administrador de alertas. Cada combinación de valores de etiqueta de group_by crearía un grupo de agregación.
Tamaño del archivo de definición del administrador de alertas	Cada región admitida: 1 000 000	No	El tamaño máximo de un archivo de definición del administrador de alertas.
Tamaño de la carga útil de alertas en el administrador de alertas	Cada región admitida: 20 000 000	No	El tamaño máximo de carga útil de todas las alertas de Alert Manager por espacio de trabajo, en bytes. El tamaño de las alertas depende de las etiquetas y las anotaciones.
Alertas en el administrador de alertas	Cada región admitida: 1000	Sí	Número máximo de alertas de administrador de alertas simultáneas por espacio de trabajo.
Clústeres del rastreador de alta disponibilidad	Cada región admitida: 500	No	El número máximo de clústeres de los que el rastreador de alta disponibilidad realizará un seguimiento para las muestras ingeridas por espacio de trabajo.
Tasa de ingesta por espacio de trabajo	Cada región compatible: 1 666 666	Sí	Tasa de ingesta de muestras de métricas por espacio de trabajo y por segundo. El límite se ajusta automáticamente para que sea 1/30 de la serie activa por límite de espacio de trabajo, hasta un máximo de 1.666.666.
Reglas de inhibición en el archivo de definición del administrador de alertas	Cada región admitida: 100	Sí	El número máximo de reglas de inhibición en el archivo de definición del administrador de alertas.
Tamaño de etiqueta	Cada región admitida: 7	No	El tamaño máximo combinado de todas las etiquetas y los valores de etiqueta aceptados para una serie.
LabelSet límites por espacio de trabajo	Cada región admitida: 100	Sí	El número máximo de límites de etiquetas que se pueden crear por espacio de trabajo.
Etiquetas por serie de métricas	Cada región admitida: 150	Sí	Número de etiquetas por serie de métricas.
Longitud de los metadatos	Cada región admitida: 1	No	La longitud máxima aceptada para los metadatos de las métricas. Los metadatos hacen referencia al nombre de métrica, el tipo, la unidad y el texto de ayuda.
Metadatos por métrica	Cada región admitida: 10	No	El número de metadatos por métrica. Nota: Si se alcanza el límite, se registra una muestra de métrica, pero se eliminan los metadatos que superen el límite.
Nodos del árbol de enrutamiento del administrador de alertas	Cada región admitida: 100	Sí	El número máximo de nodos del árbol de enrutamiento del administrador de alertas.
Número de operaciones de la API por región en transacciones por segundo	Cada región admitida: 10	Sí	El número máximo de operaciones de API por segundo por región para todas las API de Amazon Managed Service para Prometheus, incluidas las API CRUD del espacio de trabajo, las API de etiquetado, las API CRUD de los espacios de nombres de los grupos de reglas y las API CRUD de definición del administrador de alertas.
Número GetLabels y operaciones de GetSeries GetMetricMetadata API por espacio de trabajo en transacciones por segundo	Cada región admitida: 10	No	El número máximo de operaciones de GetSeries GetMetricMetadata Prometheus-compatible API GetLabels y las operaciones de API por segundo por espacio de trabajo.
Número de operaciones de QueryMetrics API por espacio de trabajo en transacciones por segundo	Cada región admitida: 300	No	El número máximo de operaciones de QueryMetrics Prometheus-compatible API por segundo por espacio de trabajo.
Número de operaciones de RemoteWrite API por espacio de trabajo en transacciones por segundo	Cada región admitida: 3000	No	El número máximo de operaciones de RemoteWrite Prometheus-compatible API por segundo por espacio de trabajo.
Número de otras operaciones de Prometheus-compatible API por espacio de trabajo en transacciones por segundo	Cada región admitida: 100	No	El número máximo de operaciones de API por segundo por espacio de trabajo para todas Prometheus-compatible las demás API ListAlerts ListRules, incluidas, etc.
Tasa de ingestión de productos fuera de servicio por espacio de trabajo	Cada región compatible: 83.333	Sí	Tasa de ingestión de muestras fuera de servicio por espacio de trabajo por segundo. A menos que se sobrescriba, el límite se ajusta automáticamente para que sea del 5 por ciento de la tasa de ingesta por límite de espacio de trabajo.
Periodo de tiempo fuera de servicio por espacio de trabajo	Cada región admitida: 600	Sí	El intervalo de tiempo máximo para las muestras no solicitadas por espacio de trabajo, en segundos.
Bytes de consulta para consultas instantáneas	Cada región admitida: 5	No	El número máximo de bytes que puede escanear una sola consulta instantánea.
Bytes de consulta para consultas de intervalo	Cada región admitida: 5	No	El número máximo de bytes que pueden escanearse por intervalo de 24 horas en una consulta de intervalo único.
Ejemplos de consulta	Cada región admitida: 50 000 000	No	El número máximo de muestras que se pueden escanear por intervalo de 24 horas en una sola consulta de rango o en una única consulta instantánea.
Series de consultas recuperadas	Cada región admitida: 12 000 000	No	El número máximo de series que se pueden escanear por intervalo de 24 horas en una consulta de rango único o en una única consulta instantánea.
Intervalo de tiempo de consulta en días	Cada región compatible: 95	No	El intervalo de tiempo máximo de QueryMetrics GetSeries, y GetLabels las API.
Solicitar tamaño	Cada región admitida: 1	No	El tamaño máximo de solicitud de ingesta o consulta.
Intervalo de evaluación de la regla	Cada región admitida: 30	Sí	El intervalo mínimo de evaluación de reglas de un grupo de reglas por espacio de trabajo.
Tamaño del archivo de definición de un espacio de nombres de grupos de reglas	Cada región admitida: 1 000 000	No	El tamaño máximo de un archivo de definición de espacio de nombres de grupos de reglas.
Reglas por espacio de trabajo	Cada región admitida: 2000	Sí	El número máximo de etiquetas por espacio de trabajo.
Escenas por espacio de trabajo	Cada región admitida: 1000	Sí	Número máximo de silencios, incluidos los silencios caducados, activos y pendientes, por espacio de trabajo.
Plantillas en el archivo de definición del administrador de alertas	Cada región admitida: 100	Sí	El número máximo de plantillas del archivo de definición del administrador de alertas.
Espacios de trabajo por región y por cuenta	Cada región admitida: 25	Sí	El número máximo de espacios de trabajo por región.

Cuotas de series activas predeterminadas

Los espacios de trabajo de Amazon Managed Service para Prometheus se adaptan automáticamente a su uso de ingesta. A medida que aumente el uso, el servicio aumenta de forma automática la capacidad de las series temporales para hasta la cuota predeterminada.

El espacio de trabajo de Amazon Managed Service para Prometheus escala automáticamente, en función de su uso, de dos formas:

Cuando el uso medio de 30 minutos es inferior a 5 millones de la serie, la capacidad se duplica (por ejemplo, un espacio de trabajo con un uso de 3,5 millones pasa a tener una capacidad de 7 millones).
Cuando el uso supera los 5 millones de series, el espacio de trabajo agrega 10 millones de búferes (por ejemplo, un espacio de trabajo con un uso de 25 millones obtiene una capacidad de 35 millones).

Amazon Managed Service para Prometheus asigna más capacidad automáticamente a medida que aumenta la ingesta, hasta su cuota. Esto ayuda a garantizar que su carga de trabajo no sufra una limitación constante. Sin embargo, esta limitación podría producirse si duplica o supera en 10 millones la referencia anterior calculada en los últimos 30 minutos. Para evitar la limitación, Amazon Managed Service para Prometheus recomienda aumentar de forma gradual la ingesta cuando supere la referencia anterior.

nota

La capacidad mínima para las series temporales activas es de 2 millones, y no hay límite cuando se dispone de menos de 2 millones de series.

Para superar esta cuota predeterminada, solicite un aumento de cuota.

Escalado por encima de la cuota predeterminada

Cuando solicita un aumento de cuota por encima de la cuota de series activas predeterminada, Amazon Managed Service para Prometheus ajusta la capacidad de su espacio de trabajo en consecuencia. Si no utiliza al máximo la capacidad aumentada, el servicio recuperará la parte no utilizada con el tiempo. A medida que aumente el uso, el espacio de trabajo volverá a escalarse verticalmente de forma automática.

Sin embargo, esta limitación podría producirse si duplica o supera los 50 millones de series temporales activas respecto a la referencia anterior calculada en las últimas 2 horas. Por ejemplo:

Si su cuota es de 100 millones y su base de referencia es de 30 millones, puede escalarla verticalmente hasta 60 millones en 2 horas sin limitación.
Si su cuota es de 100 millones y su base de referencia es de 50 millones, puede escalarla verticalmente hasta 100 millones en 2 horas sin limitación.

Limitación de la ingesta

Amazon Managed Service para Prometheus limita la ingesta de cada espacio de trabajo en función de los límites actuales. Esto lo ayuda a mantener el rendimiento del espacio de trabajo. Si superas el límite, lo verás DiscardedSamples en CloudWatch las métricas (con el rate_limited motivo). Puedes utilizarlas CloudWatch para monitorizar tu ingesta y crear una alarma que te avise cuando estés a punto de alcanzar los límites máximos. Para obtener más información, consulte Usa CloudWatch métricas para monitorear los recursos de Amazon Managed Service for Prometheus.

Amazon Managed Service para Prometheus utiliza el algoritmo de bucket de tokens para implementar la limitación de la ingesta. Con este algoritmo, su cuenta tiene un bucket que contiene un número específico de tokens. El número de tokens del bucket representa el límite de ingesta en un segundo determinado.

Cada muestra de datos ingerida quita un token del bucket. Si el tamaño del bucket (Tasa de ingesta por espacio de trabajo) es de 1 000 000, el espacio de trabajo puede ingerir un millón de muestras de datos en un segundo. Si se supera el millón de muestras en la ingesta, se limitará y no se ingerirán más registros. Las muestras de datos adicionales se descartarán.

El bucket se rellena de forma automática a una tasa fija. Si el bucket está por debajo de la capacidad máxima, se vuelve a agregar un número determinado de tokens cada segundo hasta que alcanza la capacidad máxima. Si el bucket está lleno cuando llegan los tokens de relleno, se descartan. El bucket no puede contener más del número máximo de tokens. La velocidad de relleno para la ingesta de muestras se establece según el límite de la tasa de ingesta por espacio de trabajo. Si la tasa de ingesta por espacio de trabajo está establecida a 170 000, la tasa de relleno del bucket de 170 000 tokens por segundo.

Si el espacio de trabajo ingiere más de 1 000 000 de muestras de datos en un segundo, el bucket se reduce inmediatamente a cero tokens. A continuación, el bucket se rellena con hasta 170 000 tokens por segundo hasta alcanzar la capacidad máxima de 1 000 000 de tokens. Si no se ingiere más, el bucket previamente vacío volverá a la capacidad máxima en seis segundos.

nota

La ingesta se produce en solicitudes por lotes. Si tiene 100 tokens disponibles y envía una solicitud con 101 muestras, se rechazará toda la solicitud. Amazon Managed Service para Prometheus no acepta solicitudes de forma parcial. Si está escribiendo un recopilador, puede administrar los reintentos (con lotes más pequeños o una vez transcurrido un tiempo).

No tiene que esperar a que el bucket esté lleno para que el espacio de trabajo pueda ingerir más muestras de datos. Puede usar los tokens a medida que se vayan agregando al bucket. Si utiliza inmediatamente los tokens de relleno, el bucket no alcanza la capacidad máxima. Por ejemplo, si agota el bucket, puede seguir ingiriendo 170 000 muestras de datos por segundo. El bucket puede rellenarse hasta la capacidad máxima solo si se ingieren menos de 170 000 muestras de datos por segundo.

Límites adicionales para los datos ingeridos

Amazon Managed Service para Prometheus también tiene los siguientes requisitos adicionales para los datos ingeridos en el espacio de trabajo. Estos requisitos no son ajustables.

No se permite la ingesta de muestras de métricas de más de 1 hora.
Cada muestra y cada metadato deben tener un nombre de métrica.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Eliminación de una etiqueta de un espacio de nombres de grupos de reglas

referencia de la API