CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus のリソースモニタリングする - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus のリソースモニタリングする

Amazon Managed Service for Prometheus は、使用状況メトリクスを CloudWatch に提供します。これらのメトリクスにより、ワークスペースの使用状況が可視化されます。提供されたメトリクスは、CloudWatch の AWS/Usage 名前空間と AWS/Prometheus 名前空間で確認できます。これらのメトリクスは、CloudWatch で無料で利用できます。使用状況メトリクスの詳細については、「CloudWatch の使用状況メトリクス」を参照してください。

CloudWatch メトリクス名 リソース名 CloudWatch 名前空間 説明

ResourceCount*

RemoteWriteTPS

AWS/Usage

1 秒あたりのリモート書き込みオペレーション

ResourceCount*

QueryMetricsTPS

AWS/Usage

1 秒あたりのクエリオペレーション

ResourceCount

IngestionRate

AWS/Usage

サンプルの取り込みレート

単位: カウント/秒

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

ActiveSeries

AWS/Usage

ワークスペースごとのアクティブなシリーズの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

ActiveAlerts

AWS/Usage

ワークスペースごとのアクティブなアラートの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

SizeOfAlerts

AWS/Usage

ワークスペース内のすべてのアラートの合計サイズ (バイト単位)

単位: バイト

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

SuppressedAlerts

AWS/Usage

ワークスペースごとの抑制状態にあるアラートの数。アラートは、無音や禁止にすることで抑制できます。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

UnprocessedAlerts

AWS/Usage

ワークスペースごとの未処理状態のアラートの数。アラートは AlertManager が受信すると未処理状態になりますが、次の集約グループの評価を待っているアラートです。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

AllAlerts

AWS/Usage

ワークスペースごとのすべての状態のアラート数。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ActiveSeriesPerLabelSet

-

AWS/Prometheus

各ユーザー定義ラベルセットの現在のアクティブなシリーズの使用状況

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ActiveSeriesLimitPerLabelSet

-

AWS/Prometheus

各ユーザー定義ラベルセットの現在のアクティブな系列制限値

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerAlertsReceived

-

AWS/Prometheus

アラートマネージャーが受信した正常なアラートの合計数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerNotificationsFailed

-

AWS/Prometheus

失敗したアラート配信の数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerNotificationsThrottled

-

AWS/Prometheus

スロットリングされたアラートの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

DiscardedSamples**

-

AWS/Prometheus

破棄されたサンプルの数 (理由別)

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

DiscardedSamplesPerLabelSet

-

AWS/Prometheus

ユーザー定義ラベルセットごとに破棄されたサンプルの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

IngestionRatePerLabelSet

-

AWS/Prometheus

ユーザー定義の各ラベルセットの取り込みレート

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

QuerySamplesProcessed

-

AWS/Prometheus

処理されたクエリサンプルの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleEvaluations

-

AWS/Prometheus

ルール評価の合計数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleEvaluationFailures

-

AWS/Prometheus

特定の間隔におけるルール評価の失敗の数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleGroupIterationsMissed

-

AWS/Prometheus

特定の間隔における欠落したルールグループイテレーションの数。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleGroupLastEvaluationDuration

-

AWS/Prometheus

ルールグループの最後の評価の期間。

単位: 秒

有効な統計: Average、Minimum、Maximum、Sum

*TPS メトリクスは 1 分ごとに生成され、その 1 分間の 1 秒あたりの平均です。短いバースト期間は TPS メトリクスにキャプチャされません。

**サンプルを破棄する理由には、次のようなものがあります。

理由

意味

greater_than_max_sample_age

1 時間を超えた古いサンプルを破棄します。

new-value-for-timestamp

重複するサンプルが以前の記録とは異なるタイムスタンプで送信されました。

per_labelset_series_limit

ユーザーがラベルセットあたりのアクティブな系列の総数の制限に達しました。

per_metric_series_limit

ユーザーがメトリクスごとのアクティブなシリーズ数の上限に達しました。

per_user_series_limit

ユーザーがアクティブなシリーズの合計数の上限に達しました。

rate_limited

取り込みレートが制限されました。

sample-out-of-order

サンプルが順不同で送信されたため、処理できません。

label_value_too_long

ラベル値の長さが許容される文字数の上限を超えています。

max_label_names_per_series

ユーザーがメトリクスごとのラベル名の上限数に達しました。

missing_metric_name

メトリクス名が指定されていません。

metric_name_invalid

無効なメトリクス名が指定されました。

label_invalid

無効なラベルが指定されました。

duplicate_label_names

重複するラベル名が指定されました。

注記

メトリクスがない場合は、そのメトリクスの値が 0 であることと同じ意味になります。

注記

RuleGroupIterationsMissedRuleEvaluationsRuleEvaluationFailures、および RuleGroupLastEvaluationDurationには、次の構造のRuleGroupディメンションがあります。

RuleGroupNamespace;RuleGroup

Prometheus から提供されるメトリクスへの CloudWatch アラームの設定

CloudWatch アラームを使用して、Prometheus リソースの使用状況をモニタリングできます。

Prometheus で ActiveSeries の数に対するアラームを設定するには
  1. [グラフ化したメトリクス] タブを選択し、[ActiveSeries] ラベルまでスクロールします。

    [グラフ化したメトリクス] ビューには、現在取り込まれているメトリクスのみが表示されます。

  2. [アクション] 列の [通知] アイコンを選択します。

  3. [メトリクスと条件の指定] で、[条件値] フィールドにしきい値の条件を入力し、[次へ] を選択します。

  4. [アクションの設定] で、通知の送信先となる既存の SNS トピックを選択するか、新しいトピックを作成します。

  5. [名前と説明を追加] に、アラームの名前と、必要に応じて説明を追加します。

  6. [アラームの作成] を選択します。