ルールファイルを作成する

Amazon Managed Service for Prometheus でルールを使用するには、ルールを定義するルールファイルを作成します。Amazon Managed Service for Prometheus のルールファイルは、スタンドアロンの Prometheus のルールファイルと同じ形式の YAML テキストファイルです。詳細については、Prometheus ドキュメントの「Defining Recording rules」と「Alerting rules」を参照してください。

基本的なルールファイルの例を以下に示します。


groups:
  - name: cpu_metrics
     interval: 60s
     rules:
      - record: avg_cpu_usage
        expr: avg(rate(node_cpu_seconds_total[5m])) by (instance)
      - alert: HighAverageCPU
        expr: avg_cpu_usage > 0.8
        for: 10m
        keep_firing_for: 20m
        labels:
          severity: critical
        annotations:
          summary: "Average CPU usage across cluster is too high"

この例では、60 秒ごとに評価されるルールグループ cpu_metrics を作成します。このルールグループは、avg_cpu_usage という名前の記録ルールを使用して新しいメトリクスを作成し、それをアラートで使用します。使用されるプロパティの一部について以下に説明します。含めることができるアラートルールやその他のプロパティの詳細については、Prometheus ドキュメントの「Alerting rules」を参照してください。

record: avg_cpu_usage – この記録ルールは、avg_cpu_usage という新しいメトリクスを作成します。
interval プロパティが指定されていない場合、ルールグループのデフォルトの評価間隔は 60 秒です。
expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) – この記録ルールの式は、各ノードの過去 5 分間の CPU 平均使用率を計算し、instance ラベル別にグループ化します。
alert: HighAverageCPU – このアラートルールは、HighAverageCPU という新しいアラートを作成します。
expr: avg_cpu_usage > 0.8 – この式は、CPU 平均使用率が 80% を超えるサンプルを検索するようにアラートに指示します。
for: 10m – アラートは、CPU の平均使用率が少なくとも 10 分間 80% を超えた場合にのみ発生します。

この場合、メトリクスは過去 5 分間の平均として計算されます。したがって、アラートは、平均 CPU 使用率が 80% を超える 5 分間のサンプル (合計 10 分) が連続して 2 つ以上ある場合にのみ発生します。
keep_firing_for: 20m – このアラートは、サンプルが少なくとも 20 分間しきい値を下回るまで引き続き発生します。これは、アラートが連続して上昇と下降を繰り返すのを防ぐのに役立ちます。

注記

ルール定義ファイルをローカルで作成して Amazon Managed Service for Prometheus にアップロードするか、Amazon Managed Service for Prometheus コンソール内で直接、定義を作成、編集、アップロードできます。どちらの場合でも、同じフォーマットルールが適用されます。ファイルのアップロードと編集の詳細については、「Amazon Managed Service for Prometheus にルール設定ファイルをアップロードする」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

必要な IAM アクセス許可

ルールファイルをアップロードする