Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan CloudWatch metrik untuk memantau Layanan Terkelola Amazon untuk sumber daya Prometheus
Layanan Terkelola Amazon untuk Prometheus menjual metrik penggunaan ke. CloudWatch Metrik ini memberikan visibilitas tentang pemanfaatan ruang kerja Anda. Metrik vended dapat ditemukan di AWS/Usage dan AWS/Prometheus namespace di. CloudWatch Metrik ini tersedia tanpa CloudWatch biaya. Untuk informasi selengkapnya tentang metrik penggunaan, lihat metrik penggunaan CloudWatch .
| CloudWatch nama metrik | Nama sumber daya | CloudWatch namespace | Deskripsi |
|---|---|---|---|
|
ResourceCount* |
CreateAlertManagerAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
DeleteAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetAlertManagerSilenceTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetAlertManagerStatusTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetLabelsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetMetricMetadataTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetSeriesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount |
InhibitionRulesInAlertManagerDefinition |
|
Jumlah maksimum aturan penghambatan dalam file definisi manajer peringatan. |
|
ResourceCount* |
ListAlertManagerAlertGroupInfosTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerAlertGroupsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerReceiversTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListRulesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
PutAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount |
HAReplicaGroupCount |
|
Jumlah grup replika ketersediaan tinggi |
|
ResourceCount* |
QueryMetricsTPS |
|
Operasi kueri per detik |
|
ResourceCount* |
RemoteWriteTPS |
|
Operasi tulis jarak jauh per detik |
|
ResourceCount |
ActiveAlerts |
|
Jumlah peringatan aktif per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
ActiveSeries |
|
Jumlah seri aktif per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
AlertAggregationGroupSize |
|
Ukuran maksimum grup agregasi peringatan dalam file definisi manajer peringatan. Setiap kombinasi nilai label |
|
ResourceCount |
AlertManagerDefinitionSizeBytes |
|
Ukuran maksimum file definisi manajer peringatan, dalam byte. |
|
ResourceCount |
AllSilences |
|
Jumlah maksimum keheningan, termasuk keheningan yang kedaluwarsa, aktif, dan tertunda, per ruang kerja. |
|
ResourceCount |
AllAlerts |
|
Jumlah peringatan di setiap negara bagian per ruang kerja. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
IngestionRate |
|
Tingkat konsumsi sampel Unit: Hitung per detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
RuleEvaluationInterval |
|
Interval evaluasi aturan minimum |
|
ResourceCount |
RuleGroupNamespaceDefinitionSizeBytes |
|
Ukuran maksimum file definisi namespace grup aturan, dalam byte. |
|
ResourceCount |
TemplatesInAlertManagerDefinition |
|
Jumlah maksimum template dalam file definisi manajer peringatan. |
|
ResourceCount |
WorkspaceCount |
|
Jumlah maksimum ruang kerja per Wilayah, per akunc. |
|
ResourceCount |
SizeOfAlerts |
|
Ukuran total semua peringatan di ruang kerja, dalam byte Unit: byte Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
SuppressedAlerts |
|
Jumlah peringatan dalam keadaan ditekan per ruang kerja. Peringatan dapat ditekan oleh keheningan atau penghambatan. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
UnprocessedAlerts |
|
Jumlah peringatan dalam keadaan belum diproses per ruang kerja. Peringatan dalam keadaan belum diproses setelah diterima oleh AlertManager, tetapi sedang menunggu evaluasi grup agregasi berikutnya. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
AllAlerts |
|
Jumlah peringatan di setiap negara bagian per ruang kerja. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ResourceCount |
AllRules |
|
Jumlah aturan di setiap negara bagian per ruang kerja. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
ActiveSeriesPerLabelSet |
- |
|
Penggunaan seri aktif saat ini untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ActiveSeriesLimitPerLabelSet |
- |
|
Nilai batas seri aktif saat ini untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerAlertsReceived |
- |
|
Total lansiran yang berhasil diterima oleh manajer peringatan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerNotificationsFailed |
- |
|
Jumlah pengiriman peringatan yang gagal Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerNotificationsThrottled |
- |
|
Jumlah peringatan yang dibatasi Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectors |
WorkspaceId |
|
Jumlah total detektor anomali untuk ruang kerja tertentu Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Jumlah total evaluasi detektor anomali Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorEvaluationFailures |
WorkspaceId, AnomalyDetectorId |
|
Jumlah kegagalan detektor anomali dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorLastEvaluationDuration |
WorkspaceId, AnomalyDetectorId |
|
Durasi evaluasi terakhir detektor anomali Unit: detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorMissedEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Jumlah evaluasi detektor anomali yang terlewat dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSamples** |
- |
|
Jumlah sampel yang dibuang dengan alasan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSamplesPerLabelSet |
- |
|
Jumlah sampel yang dibuang untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
IngestionRatePerLabelSet |
- |
|
Tingkat konsumsi untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
QuerySamplesProcessed |
- |
|
Jumlah sampel kueri yang diproses Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleEvaluations |
- |
|
Jumlah total evaluasi aturan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleEvaluationFailures |
- |
|
Jumlah kegagalan evaluasi aturan dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleGroupIterationsMissed |
- |
|
Jumlah iterasi Grup Aturan yang terlewatkan dalam interval. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleGroupLastEvaluationDuration |
- |
|
Durasi evaluasi terakhir kelompok aturan. Unit: detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
* Metrik TPS dihasilkan setiap menit dan merupakan rata-rata per detik selama menit itu. Periode burst pendek tidak akan ditangkap dalam metrik TPS.
** Beberapa alasan yang menyebabkan sampel dibuang adalah sebagai berikut.
|
Alasan |
Arti |
|---|---|
|
greater_than_max_sample_age |
Membuang sampel yang lebih tua dari satu jam. |
|
new-value-for-timestamp |
Sampel duplikat dikirim dengan stempel waktu yang sama dengan sampel sebelumnya tetapi dengan nilai yang berbeda. |
|
per_labelset_series_limit |
Pengguna telah mencapai jumlah total seri aktif per batas yang ditetapkan label. |
|
per_metric_series_limit |
Pengguna telah mencapai seri aktif per batas metrik. |
|
per_user_series_limit |
Pengguna telah mencapai jumlah total batas seri aktif. |
|
rate_limited |
Tingkat konsumsi terbatas. |
|
sample-out-of-order |
Sampel dikirim rusak dan tidak dapat diproses. |
|
label_value_too_long |
Nilai label lebih panjang dari batas karakter yang diizinkan. |
|
max_label_names_per_series |
Pengguna telah menekan nama label per metrik. |
|
hilang_metric_name |
Nama metrik tidak disediakan. |
|
metric_name_invalid |
Nama metrik yang diberikan tidak valid. |
|
label_invalid |
Label tidak valid disediakan. |
|
duplikate_label_names |
Nama label duplikat disediakan. |
catatan
Metrik yang tidak ada atau hilang sama dengan nilai metrik itu menjadi 0.
catatan
RuleGroupIterationsMissedRuleEvaluations,RuleEvaluationFailures,, dan RuleGroupLastEvaluationDuration memiliki RuleGroup dimensi struktur berikut:
RuleGroupNamespace;RuleGroup
Menyetel CloudWatch alarm pada metrik penjual Prometheus
Anda dapat memantau penggunaan sumber daya Prometheus menggunakan alarm. CloudWatch
Untuk mengatur alarm pada jumlah ActiveSeriesdi Prometheus
-
Pilih tab Graphed metrics dan gulir ke bawah ke label. ActiveSeries
Dalam tampilan metrik Grafik, hanya metrik yang saat ini sedang dicerna yang akan muncul.
-
Pilih ikon notifikasi di kolom Tindakan.
-
Di Tentukan metrik dan kondisi, masukkan kondisi ambang batas di bidang Nilai kondisi dan pilih Berikutnya.
-
Di Mengkonfigurasi tindakan, pilih topik SNS yang ada atau buat topik SNS baru untuk mengirim notifikasi.
-
Di Tambahkan nama dan deskripsi, tambahkan nama alarm dan deskripsi opsional.
-
Pilih Buat alarm.