Amazon Managed Service for Prometheus のサービスクォータ - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Managed Service for Prometheus のサービスクォータ

以下の 2 つのセクションでは、Amazon Managed Service for Prometheus に関連付けられているクォータと制限について説明します。

Service Quotas

Amazon Managed Service for Prometheus には、以下に示すクォータがあります。Amazon Managed Service for Prometheus は、Prometheus のリソース使用状況をモニタリングするための CloudWatch 使用状況メトリクスを提供しています。Amazon CloudWatch 使用状況メトリクスのアラーム機能を使用すると、Prometheus のリソースと使用状況をモニタリングして制限エラーを回避できます。

プロジェクトやワークスペースの拡大に伴い、モニタリングや引き上げリクエストが必要になる最も一般的なクォータは、ワークスペースごとのアクティブシリーズ数、およびワークスペースごとの取り込みレートです。

すべての調整可能なクォータでは、[調整可能] 列のリンクを選択するか、クォータの引き上げをリクエストすることにより、クォータの引き上げをリクエストできます。

ワークスペースごとのアクティブシリーズ数の制限は動的に適用されます。詳細については、「アクティブシリーズのデフォルトのクォータ」を参照してください。ワークスペースあたりの取り込みレートクォータは、ワークスペースにデータを取り込む速度を決定します。詳細については、「取り込みスロットリング」を参照してください。

注記

特に明記されていない限り、これらのクォータはワークスペースごとに設定されます。ワークスペースあたりのアクティブシリーズの最大値は 10 億です。

名前 デフォルト 引き上げ可能 説明
ワークスペースごとのメタデータを持つアクティブなメトリクス数 サポートされている各リージョン: 20,000 いいえ ワークスペースごとの、メタデータを持つ一意のアクティブなメトリクスの数。注: 制限に達すると、メトリクスサンプルは記録されますが、制限を超えたメタデータは削除されます。
ワークスペースごとのアクティブなシリーズ数 サポートされている各リージョン: 50,000,000 はい ワークスペースあたりの一意のアクティブシリーズの数 (最大 10 億)。過去 2 時間以内にサンプルが報告された場合、そのシリーズはアクティブです。2 M から 50 M までの容量は、過去 30 分間の使用状況に基づいて自動的に調整されます。
アラートマネージャー定義ファイル内のアラート集約グループのサイズ サポートされている各リージョン: 1,000 はい アラートマネージャー定義ファイル内のアラート集約グループの最大サイズ。group_by のラベル値の組み合わせごとに集約グループが作成されます。
アラートマネージャー定義ファイルのサイズ サポートされている各リージョン: 1,000,000 いいえ アラートマネージャー定義ファイルの最大サイズ (バイト単位)。
アラートマネージャーのアラートペイロードサイズ サポートされている各リージョン: 20 いいえ ワークスペースごとのすべてのアラートマネージャーアラートの最大アラートペイロードサイズ (メガバイト単位)。アラートのサイズは、ラベルと注釈に依存します。
アラートマネージャーのアラート数 サポートされている各リージョン: 1,000 はい ワースペースごとの同時アラートマネージャーアラートの最大数。
HA トラッカーのクラスター数 サポートされている各リージョン: 500 いいえ ワークスペースごとの、取り込まれたサンプルについて HA トラッカーが追跡するクラスターの最大数。
ワークスペースごとの取り込みレート サポートされている各リージョン: 170,000 はい ワークスペースごとの、1 秒あたりのメトリクスサンプルの取り込みレート。
アラートマネージャー定義ファイル内の禁止ルール数 サポートされている各リージョン: 100 はい アラートマネージャー定義ファイル内の禁止ルールの最大数。
ラベルサイズ サポートされている各リージョン: 7 いいえ 1 つのシリーズで許容される、すべてのラベルとラベル値を合わせた最大サイズ (キロバイト単位)。
ワークスペースあたりの LabelSet の制限 サポートされている各リージョン: 100 はい ワークスペースごとに作成できるラベルセット制限の最大数。
メトリクスシリーズごとのラベル数 サポートされている各リージョン: 150 はい メトリクスシリーズごとのラベルの数。
メタデータの長さ サポートされている各リージョン: 1 いいえ メトリクスのメタデータに許容される最大長 (キロバイト単位)。メタデータとは、メトリクス名、タイプ、単位、ヘルプテキストを指します。
メトリクスごとのメタデータ数 サポートされている各リージョン: 10 いいえ メトリクスごとのメタデータの数。注: 制限に達すると、メトリクスサンプルは記録されますが、制限を超えたメタデータは削除されます。
アラートマネージャーのルーティングツリー内のノード数 サポートされている各リージョン: 100 はい アラートマネージャーのルーティングツリー内の最大ノード数。
リージョンごとの API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 10 はい ワークスペース CRUD API、タグ付け API、ルールグループ名前空間 CRUD API、アラートマネージャー定義 CRUD API など、すべての Amazon Managed Service for Prometheus API のリージョンごとの 1 秒あたりの API オペレーションの最大数。
ワークスペースごとの GetSeries 、GetLabels、GetMetricMetadata API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 10 いいえ ワークスペースごとの 1 秒あたりにおける GetSeries、GetLabels、GetMetricMetadata Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの QueryMetrics API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 300 いいえ ワークスペースごとの 1 秒あたりにおける QueryMetrics Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの RemoteWrite API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 3,000 いいえ ワークスペースごとの 1 秒あたりにおける RemoteWrite Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの他の Prometheus 互換 API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 100 いいえ 他のすべての Prometheus 互換 API (ListAlerts、ListRules など) におけるワークスペースごとの 1 秒あたりの API オペレーションの最大数。
インスタントクエリのクエリバイト数 サポートされている各リージョン:5 いいえ 1 つのインスタントクエリでスキャンできる最大バイト数 (ギガバイト単位)。
範囲クエリのクエリバイト数 サポートされている各リージョン:5 いいえ 1 つの範囲クエリで 24 時間ごとにスキャンできる最大バイト数 (ギガバイト単位)。
クエリサンプル数 サポートされている各リージョン: 50,000,000 いいえ 1 つのクエリでスキャンできるサンプルの最大数。
フェッチされるクエリシリーズ数 サポートされている各リージョン: 12,000,000 いいえ 1 つのクエリでスキャンできるシリーズの最大数。
クエリ時間範囲の日数 サポートされている各リージョン: 95 いいえ QueryMetrics、GetSeries、GetLabels API の最大時間範囲。
リクエストサイズ サポートされている各リージョン: 1 いいえ 取り込みまたはクエリの最大リクエストサイズ (メガバイト単位)。
ルール評価間隔 サポートされている各リージョン: 30 はい ワークスペースあたりの、ルールグループのルール評価間隔の最小値 (秒単位)。
ルールグループ名前空間定義ファイルのサイズ サポートされている各リージョン: 1,000,000 いいえ ルールグループ名前空間定義ファイルの最大サイズ (バイト単位)。
ワークスペースごとのルール数 サポートされている各リージョン: 2,000 はい ワークスペースごとのルールの最大数。
ワークスペースあたりのサイレンス数 サポートされている各リージョン: 1,000 はい ワークスペースあたりの、期限切れ、アクティブ、保留中の無音を含む最大サイレンス数。
アラートマネージャー定義ファイル内のテンプレート数 サポートされている各リージョン: 100 はい アラートマネージャー定義ファイル内のテンプレートの最大数。
アカウントごとのリージョンあたりのワークスペース数 サポートされている各リージョン: 25 はい リージョンあたりのワークスペースの最大数。

アクティブシリーズのデフォルトのクォータ

Amazon Managed Service for Prometheus のワークスペースは、取り込み使用量に自動的に適応します。使用量の増加に応じて、サービスは、デフォルトのクォータを上限として、時系列の容量を自動的に増やします。

Amazon Managed Service for Prometheus ワークスペースは、使用状況に基づいて、次の 2 つの方法で自動的にスケールされます。

  1. 30 分の平均使用量が 500 万シリーズを下回ると、容量は 2 倍になります (例えば、350 万の使用量のワークスペースは 700 万の容量を取得します)。

  2. 使用量が 500 万シリーズを超えると、ワークスペースは 1,000 万のバッファを追加します (例えば、使用量が 2,500 万のワークスペースは 3,500 万の容量を取得します)。

Amazon Managed Service for Prometheus は、クォータまで取り込みが増加すると、より多くの容量を自動的に割り当てます。これにより、ワークロードで持続的なスロットリングが発生しなくなります。ただし、過去 30 分間に計算された前のベースラインの 2 倍または 1,000 万を超えると、スロットリングが発生する可能性があります。スロットリングを避けるため、Amazon Managed Service for Prometheus では、以前のベースラインを超えて増加する場合は、取り込み量を徐々に増やすことを推奨しています。

注記

アクティブ時系列の最小容量は 200 万で、時系列が 200 万未満の場合、スロットリングは発生しません。

デフォルトのクォータを超えるには、クォータの引き上げをリクエストできます。

デフォルトのクォータを超えるスケーリング

デフォルトのアクティブシリーズクォータを超えるクォータの引き上げをリクエストすると、Amazon Managed Service for Prometheus はそれに応じてワークスペース容量を調整します。増加した容量を十分に活用しない場合、サービスは時間の経過と共に未使用の部分を再利用します。使用量が増えると、ワークスペースは自動的に再度スケールアップします。

ただし、過去 2 時間から計算された以前のベースラインに対して 2 倍以上または 5,000 万を超えるアクティブ時系列がある場合、スロットリングが発生する可能性があります。例:

  • クォータが 1 億でベースラインが 3,000 万の場合、スロットリングなしで 2 時間以内に 6,000 万までスケールアップできます。

  • クォータが 1 億でベースラインが 5,000 万の場合、スロットリングなしで 2 時間以内に 1 億までスケールアップできます。

取り込みスロットリング

Amazon Managed Service for Prometheus は、現在の制限に基づいて、各ワークスペースの取り込みをスロットリングします。これは、ワークスペースのパフォーマンスを維持するのに役立ちます。制限を超えると、CloudWatch メトリクスに DiscardedSamples が (rate_limited の理由と共に) 表示されます。CloudWatch を使用して取り込みをモニタリングし、スロットリング制限に近づいたときに警告するアラームを作成できます。詳細については、「CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus のリソースモニタリングする」を参照してください。

Amazon Managed Service for Prometheus は、トークンバケットアルゴリズムを使用して取り込みのスロットリングを実装します。このアルゴリズムでは、アカウントには、特定の数のトークンを保持するバケットがあります。バケット内のトークンの数は、特定の秒における取り込み制限を表します。

取り込まれたデータサンプルごとに、バケットから 1 つのトークンが削除されます。バケットサイズ (ワークスペースごとの取り込みレート)1,000,000 の場合、ワークスペースは 1 秒あたり 100 万個のデータサンプルを取り込むことができます。取り込むサンプルが 100 万個を超えると、スロットリングされ、それ以上のレコードは取り込まれません。余分なデータサンプルは破棄されます。

バケットは、設定したレートで自動的に補充されます。バケットが最大容量に達していない場合、最大容量に達するまで、設定した数のトークンが毎秒追加されます。補充トークンが到着したときにバケットが満杯である場合、補充トークンは破棄されます。バケットは最大数を超えてトークンを保持することはできません。サンプル取り込みの補充レートは、ワークスペースごとの取り込みレートの制限に従って設定します。ワークスペースごとの取り込みレートを 170,000 に設定すると、バケットの補充レートは 1 秒あたり 17 万トークンになります。

ワークスペースが 1 秒間に 100 万個のデータサンプルを取り込むと、バケット内のトークン数はすぐにゼロまで減ります。その後、バケットは最大容量の 100 万トークンに達するまで、毎秒 17 万トークンずつ補充されます。最大数を超えない限り、ゼロになったバケットは 6 秒で最大容量に戻ります。

注記

取り込みはバッチリクエストで行われます。使用可能なトークンが 100 個あり、101 個のサンプルのリクエストを送信すると、リクエスト全体が拒否されます。Amazon Managed Service for Prometheus はリクエストを部分的に受け入れることはしません。コレクターを作成すると、再試行を管理できます (バッチを小さくするか、しばらく経ってから再試行します)。

バケットが満杯になるまで待たなくても、ワークスペースは追加のデータサンプルを取り込むことができます。トークンはバケットに追加されるとすぐに使用できます。補充トークンをすぐに使用すると、バケットが最大容量に達することはありません。例えば、バケットを使い果たしても、1 秒あたり 17 万個のデータサンプルを引き続き取り込むことができます。1 秒あたり 17 万未満のデータサンプルを取り込む場合のみ、バケットを最大容量まで補充できます。

取り込まれるデータに関する追加の制限

Amazon Managed Service for Prometheus には、ワークスペースに取り込まれるデータに関して次の要件があります。これらは調整できません。

  • 1 時間以上経過したメトリクスサンプルは取り込まれません。

  • すべてのサンプルとメタデータにメトリクス名が必要です。