ルールファイルを作成する - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ルールファイルを作成する

Amazon Managed Service for Prometheus でルールを使用するには、ルールを定義するルールファイルを作成します。Amazon Managed Service for Prometheus のルールファイルは、スタンドアロンの Prometheus のルールファイルと同じ形式の YAML テキストファイルです。詳細については、Prometheus ドキュメントの「Defining Recording rules」と「Alerting rules」を参照してください。

基本的なルールファイルの例を以下に示します。

groups: - name: cpu_metrics interval: 60s rules: - record: avg_cpu_usage expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) - alert: HighAverageCPU expr: avg_cpu_usage > 0.8 for: 10m keep_firing_for: 20m labels: severity: critical annotations: summary: "Average CPU usage across cluster is too high"

この例では、60 秒ごとに評価cpu_metricsされるルールグループを作成します。このルールグループは、 という名前の記録ルールを使用して新しいメトリクスを作成し、アラートでavg_cpu_usage使用します。使用されるプロパティの一部について以下に説明します。含めることができるアラートルールやその他のプロパティの詳細については、Prometheus ドキュメントの「Alerting rules」を参照してください。

  • record: avg_cpu_usage – この記録ルールは、avg_cpu_usage という新しいメトリクスを作成します。

  • interval プロパティが指定されていない場合、ルールグループのデフォルトの評価間隔は 60 秒です。

  • expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) – この記録ルールの式は、各ノードの過去 5 分間の CPU 平均使用率を計算し、instance ラベル別にグループ化します。

  • alert: HighAverageCPU – このアラートルールは、HighAverageCPU という新しいアラートを作成します。

  • expr: avg_cpu_usage > 0.8 – この式は、CPU 平均使用率が 80% を超えるサンプルを検索するようにアラートに指示します。

  • for: 10m – 式が 10 分間満たされると、アラートが発生します。この場合、各サンプルは平均 5 分を超えるため、しきい値を超えるサンプルを少なくとも 2 つ受信すると、アラートが発生します。

  • keep_firing_for: 20m – このアラートは、サンプルが少なくとも 20 分間しきい値を下回るまで引き続き発生します。これは、アラートが連続して上昇と下降を繰り返すのを防ぐのに役立ちます。

アラートルールのその他の例については、「Alerting rule examples」を参照してください。

注記

ルール定義ファイルをローカルで作成して Amazon Managed Service for Prometheus にアップロードするか、Amazon Managed Service for Prometheus コンソール内で直接、定義を作成、編集、アップロードできます。どちらの場合でも、同じフォーマットルールが適用されます。ファイルのアップロードと編集の詳細については、「Amazon Managed Service for Prometheus にルール設定ファイルをアップロードする」を参照してください。