本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Managed Service for Prometheus Service Quotas
以下兩節說明與 Amazon Managed Service for Prometheus 相關的配額和限制。
Service Quotas
Amazon Managed Service for Prometheus 具有以下配額。Amazon Managed Service for Prometheus 採用 CloudWatch 用量指標,以監控 Prometheus 資源用量。使用 Amazon CloudWatch 用量指標警示功能,您可以監控 Prometheus 資源和用量,以防止限制錯誤。
隨著專案和工作區的成長,您可能需要監控或請求增加的最常見配額為:每個工作區的啟用中序列、每個工作區的擷取率,以及每個工作區的擷取成組分解大小。
對於所有可調整的配額,您可透過選取可調整欄中的連結或請求增加配額
動態套用每個工作區的啟用中序列限制。如需詳細資訊,請參閱作用中序列預設配額。每個工作區的擷取速率和每個工作區的擷取爆量大小共同控制您可以將資料擷取到工作區的速度。如需更多資訊,請參閱擷取調節。
注意
除非另有說明,否則這些配額是每個工作區。每個工作區作用中序列的最大值為 10 億。
名稱 | 預設 | 可調整 | 描述 |
---|---|---|---|
每個工作區含中繼資料的啟用中指標 | 每個受支援的區域:20,000 | 否 | 每個工作區具有中繼資料的唯一啟用中指標數量。注意:如果達到限制,則會記錄指標範例,但會捨棄超過限制的中繼資料。 |
每個工作區的啟用中序列 | 每個受支援的區域:50,000,000 | 是 |
每個工作區的唯一作用中系列數量 (最多 10 億)。如果在過去 2 小時內呈報範例,則該序列為啟用中。從 2 M 到 50 M 的容量會根據過去 30 分鐘的使用量自動調整。 |
警示管理員定義檔案中的警示彙總群組大小 | 每個受支援的區域:1,000 | 是 |
警示管理員定義檔案中警示彙總群組的大小上限。group_by 的每個標籤值組合都會建立彙總群組。 |
警示管理員定義檔案大小 | 每個受支援的區域:1 | 否 | 警示管理員定義檔案的大小上限,以 MB 為單位。 |
警示管理員中的警示承載大小 | 每個受支援的區域:20 | 否 | 每個工作區所有警示管理員警示的最大警示承載大小,以 MB 為單位。警示大小取決於標籤和註釋。 |
警示管理員中的警示 | 每個受支援的區域:1,000 | 是 |
每個工作區的並行提醒管理員提醒數量上限。 |
HA 追蹤器叢集 | 每個受支援的區域:500 | 否 | HA 追蹤器會追蹤每個工作區擷取樣本的叢集數量上限。 |
每個工作區的擷取速率 | 每個受支援的區域:170,000 | 是 |
每個工作區每秒的指標範例擷取率。 |
警示管理員定義檔案中的抑制規則 | 每個受支援的區域:100 | 是 |
警示管理員定義檔案中抑制規則的數量上限。 |
標籤大小 | 每個支援的區域:7 | 否 | 序列接受的所有標籤和標籤值的合併大小上限,以 KB 為單位。 |
每個工作區的 LabelSet 限制 | 每個受支援的區域:100 | 是 |
每個工作區可建立的標籤集限制數目上限。 |
每個公制系列的標籤 | 每個受支援的區域:150 | 是 |
每個指標序列的標籤數量。 |
中繼資料長度 | 每個受支援的區域:1 | 否 | 指標中繼資料接受的長度上限,以 KB 為單位。中繼資料是指指標名稱、類型、單位和說明文字。 |
每個指標的中繼資料 | 每個受支援的區域:10 | 否 | 每個指標的中繼資料數量。注意:如果達到限制,則會記錄指標範例,但會捨棄超過限制的中繼資料。 |
警示管理員路由樹狀結構節點 | 每個受支援的區域:100 | 是 |
警示管理員路由樹狀結構中節點的數量上限。 |
每秒交易中每個區域的 API 操作數量 | 每個受支援的區域:10 | 是 |
所有 Amazon Managed Service for Prometheus APIs 的每秒 API 操作數目上限,包括工作區 CRUD APIs、標記 APIs、規則群組命名空間 CRUD APIs 和警示管理員定義 CRUD APIs。 |
每秒交易中每個工作區的 GetSeries、GetLabels 和 GetMetricMetadata API 操作數量 | 每個受支援的區域:10 | 否 | 每個工作區每秒 GetSeries、GetLabels 和 GetMetricMetadata Prometheus 相容 API 操作的數量上限。 |
每秒交易中每個工作區的 QueryMetrics API 操作數量 | 每個受支援的區域:300 | 否 | 每個工作區每秒的 QueryMetrics Prometheus 相容 API 操作數目上限。 |
每秒交易中每個工作區的 RemoteWrite API 操作數量 | 每個受支援的區域:3,000 個 | 否 | 每個工作區每秒的 RemoteWrite Prometheus 相容 API 操作數目上限。 |
每秒交易中每個工作區的其他 Prometheus 相容 API 操作數量 | 每個受支援的區域:100 | 否 | 所有其他 Prometheus 相容 API 的每秒 API 操作數目上限, APIs 包括 ListAlerts、ListRules 等。 |
查詢位元組以進行即時查詢 | 每個受支援的區域:5 | 否 | 單一即時查詢可掃描的最大位元組數,以 GB 為單位。 |
範圍查詢的查詢位元組 | 每個受支援的區域:5 | 否 | 在單一範圍查詢中,每 24 小時間隔可以掃描的最大位元組數,以 GB 為單位。 |
範例查詢 | 每個受支援的區域:50,000,000 | 否 | 單一查詢期間可掃描的最大範例數量。 |
查詢序列擷取 | 每個受支援的區域:12,000,000 | 否 | 單一查詢期間可掃描的最大序列數量。 |
查詢時間範圍 (天) | 每個支援的區域:95 | 否 | QueryMetrics、GetSeries 和 GetLabels APIs 的最大時間範圍。 |
請求規模 | 每個受支援的區域:1 | 否 | 擷取或查詢的請求大小上限,以 MB 為單位。 |
規則評估間隔 | 每個受支援的區域:30 | 是 |
每個工作區規則群組的最小規則評估間隔,以秒為單位。 |
規則群組命名空間定義檔大小 | 每個受支援的區域:1 | 否 | 規則群組命名空間定義檔案的大小上限,以 MB 為單位。 |
每個工作區的規則 | 每個受支援的區域:2,000 | 是 |
每個工作區的規則數量上限。 |
每個工作區的靜音數 | 每個受支援的區域:1,000 | 是 |
每個工作區的靜音數量上限,包括過期、作用中和待定的靜音。 |
警示管理員定義檔案中的範本 | 每個受支援的區域:100 | 是 |
警示管理員定義檔案中的範本數量上限。 |
每個帳戶每個區域的工作 | 每個受支援的區域:25 | 是 |
每個區域的工作區的數量上限。 |
作用中序列預設配額
Amazon Managed Service for Prometheus 工作區會自動適應您的擷取用量。隨著用量增加,服務會自動將您的時間序列容量增加到預設配額。
您的 Amazon Managed Service for Prometheus 工作區會根據您的用量,以兩種方式自動擴展:
-
當您的 30 分鐘平均用量低於 500 萬個序列時,容量會加倍 (例如,使用 350 萬的工作區會獲得 7M個容量)。
-
當用量超過 500 萬個系列時,工作區會新增 1,000 萬個緩衝區 (例如,使用量為 25M的工作區會取得 35M個容量)。
Amazon Managed Service for Prometheus 會在擷取增加時自動配置更多容量,最高可達您的配額。這有助於確保您的工作負載不會經歷持續限流。不過,如果您在過去 30 分鐘內計算的基準加倍或超過 1,000 萬,則可能會發生限流。為了避免限流,Amazon Managed Service for Prometheus 建議在超出先前基準時逐漸增加擷取。
注意
作用中時間序列的最小容量為 200 萬,當您的序列少於 200 萬個時,就不會進行限流。
若要超出預設配額,您可以請求提高配額
擴展超過預設配額
當您請求增加配額超過預設作用中序列配額時,Amazon Managed Service for Prometheus 會相應地調整您的工作區容量。如果您未充分利用增加的容量,服務將隨著時間回收未使用的部分。隨著用量的增加,工作區將自動再次擴展。
不過,如果您超過過去 2 小時內計算的先前基準的兩倍或超過 5,000 萬個作用中時間序列,則可能會發生限流。例如:
-
如果您的配額為 1 億,而基準為 3000 萬,您可以在 2 小時內擴展到 6000 萬,而無需調節。
-
如果您的配額為 1 億,而基準為 5000 萬,您可以在 2 小時內擴展到完整的 1 億,而無需調節。
擷取調節
Amazon Managed Service for Prometheus 會根據您目前的限制,調節每個工作區的擷取。這有助於維持工作區的效能。如果您超過限制,您會在 CloudWatch 指標DiscardedSamples
中看到 (包含rate_limited
原因)。您可以使用 CloudWatch 來監控您的擷取,並建立警示,在接近限流限制時提醒您。如需詳細資訊,請參閱使用 CloudWatch 指標監控 Amazon Managed Service for Prometheus 資源。
Amazon Managed Service for Prometheus 使用字符儲存貯體演算法
擷取的每個資料範例都會從儲存貯體中移除一個字符。如果您的儲存貯體大小 (每個工作區的擷取爆量大小) 為 1,000,000,則您的工作區可以在一秒內擷取一百萬個資料範例。如果超過 100 萬個要擷取的樣本,它會受到調節,而且不會再擷取任何記錄。其他資料範例將被捨棄。
儲存貯體會自動以設定的速率重新填充。如果儲存貯體低於容量上限,則每秒會新增一組字符數量,直到達到容量上限為止。如果補充字符送達時儲存貯體已滿,則會捨棄它們。儲存貯體不能保留超過其字符數量上限。範例擷取的重新填充速率由每個工作區限制的擷取速率設定。如果每個工作區的擷取速率設定為 170,000,則儲存貯體的重新填充速率為每秒 170,000 個字符。
如果您的工作區每秒擷取 1,000,000 個資料範例,您的儲存貯體會立即減少為零權杖。然後,儲存貯體每秒會重新填充 170,000 個字符,直到達到 1,000,000 個字符的最大容量為止。如果沒有更多擷取,先前空白的儲存貯體會在 6 秒內回到其最大容量。
注意
擷取發生在批次請求中。如果您有 100 個字符可用,並傳送具有 101 個範例的請求,則會拒絕整個請求。Amazon Managed Service for Prometheus 不會部分接受請求。如果您要寫入收集器,您可以管理重試 (批次較小或經過一段時間後)。
您不需要等待儲存貯體已滿,工作區才能擷取更多資料範例。您可以在權杖新增至儲存貯體時使用權杖。如果您立即使用重新填充字符,則儲存貯體不會達到其容量上限。例如,如果您耗盡儲存貯體,您可以繼續每秒擷取 170,000 個資料範例。只有在每秒擷取少於 170,000 個資料範例時,儲存貯體才能重新填充至最大容量。
對擷取資料的其他限制
針對擷取到工作區的資料,Amazon Managed Service for Prometheus 也有下列額外要求。這些不可調整。
-
拒絕擷取超過 1 小時的指標範例。
-
每個範例和中繼資料都必須有指標名稱。