Service Quotas 활성 시리즈 할당량 기본 할당량을 초과하는 확장 수집 스로틀링 수집된 데이터에 대한 추가 제한

Amazon Managed Service for Prometheus 서비스 할당량

다음 두 섹션에서는 Amazon Managed Service for Prometheus와 관련된 할당량 및 제한에 대해 설명합니다.

Service Quotas

Amazon Managed Service for Prometheus의 할당량은 다음과 같습니다. Amazon Managed Service for Prometheus는 Prometheus 리소스 사용량을 모니터링하기 위한 CloudWatch 사용량 지표를 제공합니다. Amazon CloudWatch 사용량 지표 경보 기능을 사용하면 Prometheus 리소스 및 사용량을 모니터링하여 제한 오류를 방지할 수 있습니다.

프로젝트와 워크스페이스가 확장됨에 따라 모니터링하거나 증량을 요청해야 할 가장 일반적인 할당량은 워크스페이스별 활성 시리즈와 워크스페이스별 수집 속도입니다.

조정 가능한 모든 할당량의 경우 조정 가능 열의 링크를 선택하거나 할당량 증가를 요청하여 할당량 증가를 요청할 수 있습니다.

워크스페이스별 활성 시리즈 제한은 동적으로 적용됩니다. 자세한 내용은 활성 시리즈 할당량 단원을 참조하십시오. 워크스페이스별 수집 속도 할당량에 따라 워크스페이스로 데이터를 수집할 수 있는 속도가 결정됩니다. 자세한 내용은 수집 스로틀링을 참조하세요.

참고

달리 명시되지 않는 한, 이러한 할당량은 워크스페이스를 기준으로 합니다. 워크스페이스별 활성 시리즈의 최댓값은 10억입니다.

이름	기본값	조정 가능	설명
WorkSpace별 메타데이터가 포함된 활성 지표	지원되는 각 리전: 20,000	아니요	워크스페이스당 메타데이터가 포함된 고유한 활성 지표의 수입니다. 참고: 한도에 도달하면 지표 샘플이 기록되지만 한도를 초과하는 메타데이터는 삭제됩니다.
워크스페이스별 활성 시리즈	지원되는 각 리전: 50,000,000	예	워크스페이스당 고유한 활성 시리즈 수(최대 10억)입니다. 지난 2시간 동안 샘플이 보고된 경우 시리즈는 활성 상태입니다. 용량(2M~50M)은 지난 30분의 사용량을 기준으로 자동 조정됩니다.
알림 관리자 정의 파일의 알림 집계 그룹 크기	지원되는 각 리전: 1,000	예	알림 관리자 정의 파일에 있는 알림 집계 그룹의 최대 크기입니다. group_by의 각 레이블 값 조합으로 집계 그룹이 생성됩니다.
알림 관리자 정의 파일 크기	지원되는 각 리전: 1,000,000	아니요	알림 관리자 정의 파일의 최대 크기(바이트)입니다.
알림 관리자의 알림 페이로드 크기	지원되는 각 리전: 20,000,000	아니요	워크스페이스당 모든 Alert Manager 알림의 최대 알림 페이로드 크기는 바이트입니다. 알림 크기는 레이블과 주석에 따라 달라집니다.
알림 관리자의 알림	지원되는 각 리전: 1,000	예	워크스페이스당 동시 알림 관리자 알림의 최대 수입니다.
HA 추적기 클러스터	지원되는 각 리전: 500	아니요	워크스페이스별로 수집된 샘플에 대해 HA 추적기가 추적하는 최대 클러스터 수입니다.
워크스페이스별 수집 속도	지원되는 각 리전: 1,666,666	예	초당 워크스페이스별 지표 샘플 수집 속도입니다. 한도는 워크스페이스 한도당 활성 시리즈의 1/30, 최대 1,666,666까지 자동으로 조정됩니다.
알림 관리자 정의 파일의 금지 규칙	지원되는 각 리전: 100	예	알림 관리자 정의 파일의 최대 금지 규칙 수입니다.
레이블 크기	지원되는 각 리전: 7	아니요	시리즈에 허용되는 모든 레이블 및 레이블 값을 합친 최대 크기(KB)입니다.
워크스페이스당 LabelSet 제한	지원되는 각 리전: 100	예	워크스페이스당 생성할 수 있는 labelset 제한의 최대 수입니다.
지표 시리즈별 레이블	지원되는 각 리전: 150	예	지표 시리즈별 레이블 수입니다.
메타데이터 길이	지원되는 각 리전: 1	아니요	지표 메타데이터에 허용되는 최대 길이(KB)입니다. 메타데이터는 지표 이름, 유형, 단위 및 도움말 텍스트를 나타냅니다.
지표별 메타데이터	지원되는 각 리전: 10	아니요	지표별 메타데이터 수입니다. 참고: 한도에 도달하면 지표 샘플이 기록되지만 한도를 초과하는 메타데이터는 삭제됩니다.
알림 관리자 라우팅 트리의 노드	지원되는 각 리전: 100	예	알림 관리자 라우팅 트리의 최대 노드 수입니다.
초당 트랜잭션의 리전당 API 작업 수	지원되는 각 리전: 10개	예	워크스페이스 CRUD API, 태그 지정 API, 규칙 그룹 네임스페이스 CRUD API, 알림 관리자 정의 CRUD API를 포함하여 모든 Amazon Managed Service for Prometheus API에 대해 리전별로 초당 수행할 수 있는 최대 API 작업 수입니다.
초당 트랜잭션의 워크스페이스당 GetSeries, GetLabels 및 GetMetricMetadata API 작업 수	지원되는 각 리전: 10	아니요	워크스페이스당 초당 GetSeries, GetLabels 및 GetMetricMetadata Prometheus 호환 API 작업의 최대 수입니다.
초당 트랜잭션의 워크스페이스당 QueryMetrics API 작업 수	지원되는 각 리전: 300	아니요	워크스페이스당 초당 QueryMetrics Prometheus 호환 API 작업의 최대 수입니다.
초당 트랜잭션의 워크스페이스당 RemoteWrite API 작업 수	지원되는 각 리전: 3,000	아니요	워크스페이스당 초당 RemoteWrite Prometheus 호환 API 작업의 최대 수입니다.
초당 트랜잭션의 워크스페이스당 다른 Prometheus 호환 API 작업 수	지원되는 각 리전: 100	아니요	ListAlerts, ListRules 등을 포함한 다른 모든 Prometheus 호환 API에 대한 워크스페이스당 초당 최대 API 작업 수입니다.
워크스페이스당 순서에 맞지 않는 수집률	지원되는 각 리전: 83,333	예	순서에 맞지 않는 샘플 초당 워크스페이스당 수집 속도입니다. 덮어쓰지 않는 한 제한은 워크스페이스당 수집 속도 제한의 5%로 자동 조정됩니다.
워크스페이스당 주문 외 기간	지원되는 각 지역: 600	예	워크스페이스당 순서를 벗어난 샘플의 최대 기간으로, 초 단위입니다.
인스턴트 쿼리의 쿼리 바이트	지원되는 각 리전: 5	아니요	단일 인스턴트 쿼리로 스캔할 수 있는 최대 바이트 수(GB)입니다.
범위 쿼리의 쿼리 바이트	지원되는 각 리전: 5	아니요	단일 범위 쿼리에서 24시간 간격으로 스캔할 수 있는 최대 바이트 수(GB)입니다.
쿼리 샘플	지원되는 각 리전: 50,000,000	아니요	단일 범위 쿼리 또는 단일 인스턴트 쿼리에서 24시간 간격당 스캔할 수 있는 최대 샘플 수입니다.
가져온 쿼리 시리즈	지원되는 각 리전: 12,000,000	아니요	단일 범위 쿼리 또는 단일 인스턴트 쿼리에서 24시간 간격당 스캔할 수 있는 최대 시리즈 수입니다.
쿼리 시간 범위(일)	지원되는 각 리전: 95	아니요	QueryMetrics, GetSeries 및 GetLabels API의 최대 시간 범위입니다.
요청 크기	지원되는 각 리전: 1	아니요	수집 또는 쿼리의 최대 요청 크기(MB)입니다.
규칙 평가 간격	지원되는 각 지역: 30개	예	워크스페이스별 규칙 그룹의 최소 규칙 평가 간격(초)입니다.
규칙 그룹 네임스페이스 정의 파일 크기	지원되는 각 리전: 1,000,000	아니요	규칙 그룹 네임스페이스 정의 파일의 최대 크기(바이트)입니다.
워크스페이스별 규칙	지원되는 각 리전: 2,000	예	워크스페이스별 최대 규칙 수입니다.
워크스페이스당 무음	지원되는 각 리전: 1,000	예	워크스페이스당 최대 무음 수(만료, 활성 및 보류 중인 무음 포함)입니다.
알림 관리자 정의 파일의 템플릿	지원되는 각 리전: 100	예	알림 관리자 정의 파일의 최대 템플릿 수입니다.
계정당 리전별 워크스페이스	지원되는 각 지역: 25	예	리전별 최대 워크스페이스 수입니다.

활성 시리즈 할당량

Amazon Managed Service for Prometheus 워크스페이스는 수집 사용량에 맞춰 자동으로 조정됩니다. 사용량이 증가하면 서비스가 자동으로 시계열 용량을 기본 할당량까지 늘립니다.

Amazon Managed Service for Prometheus 워크스페이스는 사용량에 따라 다음 두 가지 방식으로 자동 확장됩니다.

30분 평균 사용량이 500만 개 미만의 시리즈인 경우 용량이 두 배로 증가합니다(예: 사용량이 350만 개인 워크스페이스는 700만 개의 용량을 얻음).
사용량이 500만 개의 시리즈를 초과하면 워크스페이스에는 1,000만 개의 버퍼가 추가됩니다(예: 사용량이 2,500만 개인 워크스페이스는 3,500만 개의 용량을 얻음).

Amazon Managed Service for Prometheus는 수집이 증가함에 따라 할당량 범위까지 더 많은 용량을 자동으로 할당합니다. 이렇게 하면 워크로드에 지속적인 스로틀링이 발생하지 않습니다. 그러나 지난 30분 동안 계산된 이전 기준을 두 배 이상 초과하거나 1,000만 이상 초과할 경우 스로틀링이 발생할 수 있습니다. 스로틀링을 방지하기 위해 Amazon Managed Service for Prometheus는 이전 기준을 초과하여 증가할 때 수집량을 점진적으로 늘릴 것을 권장합니다.

참고

활성 시리즈의 최소 용량은 200만 개이며, 시리즈 수가 200만 개 미만일 경우 스로틀링이 적용되지 않습니다.

기본 할당량을 초과하여 사용하려면 할당량 증가를 요청할 수 있습니다.

기본 할당량을 초과하는 확장

기본 활성 시리즈 할당량 이상으로 할당량 증가를 요청하면 Amazon Managed Service for Prometheus에서는 해당 요청에 따라 워크스페이스 용량을 조정합니다. 증가된 용량을 완전히 활용하지 않으면 서비스는 시간이 지남에 따라 미사용 부분을 회수합니다. 사용량이 증가하면 워크스페이스가 자동으로 스케일 업됩니다.

그러나 지난 2시간 동안 계산된 이전 기준 대비 활성 시계열이 두 배 이상 증가하거나 5,000만 개를 초과할 경우에는 스로틀링이 발생할 수 있습니다. 예제:

할당량이 1억이고 기준이 3,000만인 경우, 2시간 이내에 스로틀링 없이 6,000만까지 스케일 업할 수 있습니다.
할당량이 1억이고 기준이 5,000만인 경우, 2시간 이내에 스로틀링 없이 전체 1억까지 스케일 업할 수 있습니다.

수집 스로틀링

Amazon Managed Service for Prometheus는 현재 한도에 따라 각 워크스페이스의 수집을 제한합니다. 이는 워크스페이스의 성능을 유지하는 데 도움이 됩니다. 한도를 초과하면 CloudWatch 지표에 DiscardedSamples이 표시됩니다(rate_limited 이유 포함). CloudWatch를 사용하여 수집을 모니터링하고 스로틀링 한도에 근접했을 때 경고하는 알림을 생성할 수 있습니다. 자세한 내용은 CloudWatch 지표를 사용하여 Amazon Managed Service for Prometheus 리소스 모니터링 단원을 참조하십시오.

Amazon Managed Service for Prometheus는 토큰 버킷 알고리즘을 사용하여 수집 제한을 구현합니다. 이 알고리즘을 사용하면 계정에 특정 수의 토큰을 보관하는 버킷이 있습니다. 버킷의 토큰 수는 지정된 초당 수집 한도를 나타냅니다.

수집된 각 데이터 샘플은 버킷에서 토큰 하나를 제거합니다. 버킷 크기(워크스페이스별 수집 속도)가 1,000,000인 경우 해당 워크스페이스는 1초에 백만 개의 데이터 샘플을 수집할 수 있습니다. 수집하는 샘플이 100만 개를 초과하는 경우, 이는 제한되며 더 이상 레코드를 수집하지 않습니다. 추가 데이터 샘플은 폐기됩니다.

버킷은 설정된 속도로 자동으로 다시 채워집니다. 버킷이 최대 용량 미만이면 최대 용량에 도달할 때까지 매초마다 정해진 수의 토큰이 버킷에 다시 추가됩니다. 다시 채우기 토큰이 도착했을 때 버킷이 다 차면 토큰은 폐기됩니다. 버킷은 최대 토큰 수를 초과하여 보관할 수 없습니다. 샘플 수집에 대한 다시 채우기 속도는 워크스페이스별 수집 속도 한도에 따라 설정됩니다. 워크스페이스별 수집 속도가 170,000으로 설정된 경우 버킷의 다시 채우기 속도는 초당 170,000개의 토큰입니다.

워크스페이스가 1초에 1,000,000개의 데이터 샘플을 수집하면 버킷이 토큰 0개로 즉시 축소됩니다. 그러면 토큰이 최대 용량 1,000,000개에 도달할 때까지 매초마다 170,000개의 토큰이 버킷에 다시 채워집니다. 더 이상 수집하지 않으면 이전에 빈 버킷이 6초 후에 최대 용량으로 돌아갑니다.

참고

수집은 배치 요청에서 발생합니다. 사용 가능한 토큰이 100개이고 샘플이 101개 있는 요청을 보내면 전체 요청이 거부됩니다. Amazon Managed Service for Prometheus는 요청을 부분적으로 수락하지 않습니다. 수집기를 작성하는 경우 재시도를 관리할 수 있습니다(보다 작은 배치로 또는 일정 시간이 지난 후).

워크스페이스가 더 많은 데이터 샘플을 수집하기 전에 버킷이 가득 찰 때까지 기다릴 필요가 없습니다. 버킷에 추가된 토큰은 그대로 사용할 수 있습니다. 다시 채우기 토큰을 즉시 사용하는 경우 버킷이 최대 용량에 도달하지 않습니다. 예를 들어 버킷이 고갈된 경우 초당 170,000개의 데이터 샘플을 계속 수집할 수 있습니다. 버킷은 초당 170,000개 미만의 데이터 샘플을 수집하는 경우에만 최대 용량으로 다시 채울 수 있습니다.

수집된 데이터에 대한 추가 제한

Amazon Managed Service for Prometheus에서는 워크스페이스로 수집된 데이터에 대해 다음과 같은 추가 요구 사항이 적용됩니다. 조정할 수 없습니다.

1시간이 지난 지표 샘플은 수집이 거부됩니다.
모든 샘플과 메타데이터에는 지표 이름이 있어야 합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

규칙 그룹 네임스페이스에서 태그 제거

API 참조