Menggunakan CloudWatch metrik untuk memantau Layanan Terkelola Amazon untuk sumber daya Prometheus - Layanan Terkelola Amazon untuk Prometheus

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan CloudWatch metrik untuk memantau Layanan Terkelola Amazon untuk sumber daya Prometheus

Layanan Terkelola Amazon untuk Prometheus menjual metrik penggunaan ke. CloudWatch Metrik ini memberikan visibilitas tentang pemanfaatan ruang kerja Anda. Metrik vended dapat ditemukan di AWS/Usage dan AWS/Prometheus namespace di. CloudWatch Metrik ini tersedia tanpa CloudWatch biaya. Untuk informasi selengkapnya tentang metrik penggunaan, lihat metrik penggunaan CloudWatch .

CloudWatch nama metrik Nama sumber daya CloudWatch namespace Deskripsi

ResourceCount*

CreateAlertManagerAlertsTPS

AWS/Usage

Jumlah maksimum operasi CreateAlertManagerAlerts API per detik, per ruang kerja

ResourceCount*

DeleteAlertManagerSilencesTPS

AWS/Usage

Jumlah maksimum operasi DeleteAlertManagerSilences API per detik, per ruang kerja

ResourceCount*

GetAlertManagerSilenceTPS

AWS/Usage

Jumlah maksimum operasi GetAlertManagerSilence API per detik, per ruang kerja

ResourceCount*

GetAlertManagerStatusTPS

AWS/Usage

Jumlah maksimum operasi GetAlertManagerStatus API per detik, per ruang kerja

ResourceCount*

GetLabelsTPS

AWS/Usage

Jumlah maksimum operasi GetLabels API per detik, per ruang kerja

ResourceCount*

GetMetricMetadataTPS

AWS/Usage

Jumlah maksimum operasi GetMetricMetadata API per detik, per ruang kerja

ResourceCount*

GetSeriesTPS

AWS/Usage

Jumlah maksimum operasi GetSeries API per detik, per ruang kerja

ResourceCount

InhibitionRulesInAlertManagerDefinition

AWS/Usage

Jumlah maksimum aturan penghambatan dalam file definisi manajer peringatan.

ResourceCount*

ListAlertManagerAlertGroupInfosTPS

AWS/Usage

Jumlah maksimum operasi ListAlertManagerAlertGroupInfos API per detik, per ruang kerja

ResourceCount*

ListAlertManagerAlertGroupsTPS

AWS/Usage

Jumlah maksimum operasi ListAlertManagerAlertGroups API per detik, per ruang kerja

ResourceCount*

ListAlertManagerAlertsTPS

AWS/Usage

Jumlah maksimum operasi ListAlertManagerAlerts API per detik, per ruang kerja

ResourceCount*

ListAlertManagerReceiversTPS

AWS/Usage

Jumlah maksimum operasi ListAlertManagerReceivers API per detik, per ruang kerja

ResourceCount*

ListAlertManagerSilencesTPS

AWS/Usage

Jumlah maksimum operasi ListAlertManagerSilences API per detik, per ruang kerja

ResourceCount*

ListAlertsTPS

AWS/Usage

Jumlah maksimum operasi ListAlerts API per detik, per ruang kerja

ResourceCount*

ListRulesTPS

AWS/Usage

Jumlah maksimum operasi ListRules API per detik, per ruang kerja

ResourceCount*

PutAlertManagerSilencesTPS

AWS/Usage

Jumlah maksimum operasi PutAlertManagerSilences API per detik, per ruang kerja

ResourceCount

HAReplicaGroupCount

AWS/Usage

Jumlah grup replika ketersediaan tinggi

ResourceCount*

QueryMetricsTPS

AWS/Usage

Operasi kueri per detik

ResourceCount*

RemoteWriteTPS

AWS/Usage

Operasi tulis jarak jauh per detik

ResourceCount

ActiveAlerts

AWS/Usage

Jumlah peringatan aktif per ruang kerja

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

ActiveSeries

AWS/Usage

Jumlah seri aktif per ruang kerja

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

AlertAggregationGroupSize

AWS/Usage

Ukuran maksimum grup agregasi peringatan dalam file definisi manajer peringatan. Setiap kombinasi nilai label group_by akan membuat grup agregasi.

ResourceCount

AlertManagerDefinitionSizeBytes

AWS/Usage

Ukuran maksimum file definisi manajer peringatan, dalam byte.

ResourceCount

AllSilences

AWS/Usage

Jumlah maksimum keheningan, termasuk keheningan yang kedaluwarsa, aktif, dan tertunda, per ruang kerja.

ResourceCount

AllAlerts

AWS/Usage

Jumlah peringatan di negara bagian mana pun per ruang kerja.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

IngestionRate

AWS/Usage

Tingkat konsumsi sampel

Satuan: hitung per detik

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

RuleEvaluationInterval

AWS/Usage

Interval evaluasi aturan minimum

ResourceCount

RuleGroupNamespaceDefinitionSizeBytes

AWS/Usage

Ukuran maksimum file definisi namespace grup aturan, dalam byte.

ResourceCount

TemplatesInAlertManagerDefinition

AWS/Usage

Jumlah maksimum template dalam file definisi manajer peringatan.

ResourceCount

WorkspaceCount

AWS/Usage

Jumlah maksimum ruang kerja per Wilayah, per akuntc.

ResourceCount

SizeOfAlerts

AWS/Usage

Ukuran total semua peringatan di ruang kerja, dalam byte

Unit: byte

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

SuppressedAlerts

AWS/Usage

Jumlah peringatan dalam keadaan ditekan per ruang kerja. Peringatan dapat ditekan oleh keheningan atau penghambatan.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

UnprocessedAlerts

AWS/Usage

Jumlah peringatan dalam status yang belum diproses per ruang kerja. Peringatan dalam keadaan belum diproses setelah diterima oleh AlertManager, tetapi sedang menunggu evaluasi grup agregasi berikutnya.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

AllAlerts

AWS/Usage

Jumlah peringatan di negara bagian mana pun per ruang kerja.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ResourceCount

AllRules

AWS/Usage

Jumlah aturan di setiap negara bagian per ruang kerja.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ActiveSeriesPerLabelSet

-

AWS/Prometheus

Penggunaan seri aktif saat ini untuk setiap set label yang ditentukan pengguna

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

ActiveSeriesLimitPerLabelSet

-

AWS/Prometheus

Nilai batas seri aktif saat ini untuk setiap set label yang ditentukan pengguna

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

AlertManagerAlertsReceived

-

AWS/Prometheus

Total lansiran yang berhasil diterima oleh manajer peringatan

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

AlertManagerNotificationsFailed

-

AWS/Prometheus

Jumlah pengiriman peringatan yang gagal

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

AlertManagerNotificationsThrottled

-

AWS/Prometheus

Jumlah peringatan yang dibatasi

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

DiscardedSamples**

-

AWS/Prometheus

Jumlah sampel yang dibuang dengan alasan

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

DiscardedSamplesPerLabelSet

-

AWS/Prometheus

Jumlah sampel yang dibuang untuk setiap set label yang ditentukan pengguna

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

IngestionRatePerLabelSet

-

AWS/Prometheus

Tingkat konsumsi untuk setiap set label yang ditentukan pengguna

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

QuerySamplesProcessed

-

AWS/Prometheus

Jumlah sampel kueri yang diproses

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

RuleEvaluations

-

AWS/Prometheus

Jumlah total evaluasi aturan

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

RuleEvaluationFailures

-

AWS/Prometheus

Jumlah kegagalan evaluasi aturan dalam interval

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

RuleGroupIterationsMissed

-

AWS/Prometheus

Jumlah iterasi Grup Aturan yang terlewatkan dalam interval.

Unit: hitung

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

RuleGroupLastEvaluationDuration

-

AWS/Prometheus

Durasi evaluasi terakhir kelompok aturan.

Unit: detik

Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah

* Metrik TPS dihasilkan setiap menit dan merupakan rata-rata per detik selama menit itu. Periode burst pendek tidak akan ditangkap dalam metrik TPS.

** Beberapa alasan yang menyebabkan sampel dibuang adalah sebagai berikut.

Alasan

Arti

greater_than_max_sample_age

Membuang sampel yang lebih tua dari satu jam.

new-value-for-timestamp

Sampel duplikat dikirim dengan stempel waktu yang sama dengan sampel sebelumnya tetapi dengan nilai yang berbeda.

per_labelset_series_limit

Pengguna telah mencapai jumlah total seri aktif per batas yang ditetapkan label.

per_metric_series_limit

Pengguna telah mencapai seri aktif per batas metrik.

per_user_series_limit

Pengguna telah mencapai jumlah total batas seri aktif.

rate_limited

Tingkat konsumsi terbatas.

sample-out-of-order

Sampel dikirim rusak dan tidak dapat diproses.

label_value_too_long

Nilai label lebih panjang dari batas karakter yang diizinkan.

max_label_names_per_series

Pengguna telah menekan nama label per metrik.

hilang_metric_name

Nama metrik tidak disediakan.

metric_name_invalid

Nama metrik yang diberikan tidak valid.

label_invalid

Label tidak valid disediakan.

duplicate_label_names

Nama label duplikat disediakan.

catatan

Metrik yang tidak ada atau hilang sama dengan nilai metrik itu menjadi 0.

catatan

RuleGroupIterationsMissedRuleEvaluations,RuleEvaluationFailures,, dan RuleGroupLastEvaluationDuration memiliki RuleGroup dimensi struktur berikut:

RuleGroupNamespace;RuleGroup

Menyetel CloudWatch alarm pada metrik penjual Prometheus

Anda dapat memantau penggunaan sumber daya Prometheus menggunakan alarm. CloudWatch

Untuk mengatur alarm pada jumlah ActiveSeriesdi Prometheus
  1. Pilih tab Graphed metrics dan gulir ke bawah ke label. ActiveSeries

    Dalam tampilan metrik Grafik, hanya metrik yang saat ini sedang dicerna yang akan muncul.

  2. Pilih ikon notifikasi di kolom Tindakan.

  3. Di Tentukan metrik dan kondisi, masukkan kondisi ambang batas di bidang Nilai kondisi dan pilih Berikutnya.

  4. Di Mengkonfigurasi tindakan, pilih topik SNS yang ada atau buat topik SNS baru untuk mengirim notifikasi.

  5. Di Tambahkan nama dan deskripsi, tambahkan nama alarm dan deskripsi opsional.

  6. Pilih Buat alarm.