Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan CloudWatch metrik untuk memantau Layanan Terkelola Amazon untuk sumber daya Prometheus
Layanan Terkelola Amazon untuk Prometheus menjual metrik penggunaan ke. CloudWatch Metrik ini memberikan visibilitas tentang pemanfaatan ruang kerja Anda. Metrik vended dapat ditemukan di AWS/Usage dan AWS/Prometheus namespace di. CloudWatch Metrik ini tersedia tanpa CloudWatch biaya. Untuk informasi selengkapnya tentang metrik penggunaan, lihat metrik penggunaan CloudWatch .
| CloudWatch nama metrik | Nama sumber daya | CloudWatch namespace | Deskripsi |
|---|---|---|---|
|
ResourceCount* |
CreateAlertManagerAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
DeleteAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetAlertManagerSilenceTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetAlertManagerStatusTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetLabelsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetMetricMetadataTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
GetSeriesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount |
InhibitionRulesInAlertManagerDefinition |
|
Jumlah maksimum aturan penghambatan dalam file definisi manajer peringatan. |
|
ResourceCount* |
ListAlertManagerAlertGroupInfosTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerAlertGroupsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerReceiversTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListAlertsTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
ListRulesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount* |
PutAlertManagerSilencesTPS |
|
Jumlah maksimum operasi |
|
ResourceCount |
HAReplicaGroupCount |
|
Jumlah grup replika ketersediaan tinggi |
|
ResourceCount* |
QueryMetricsTPS |
|
Operasi kueri per detik |
|
ResourceCount* |
RemoteWriteTPS |
|
Operasi tulis jarak jauh per detik |
|
ResourceCount |
ActiveAlerts |
|
Jumlah peringatan aktif per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
ActiveSeries |
|
Jumlah seri aktif per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
AlertAggregationGroupSize |
|
Ukuran maksimum grup agregasi peringatan dalam file definisi manajer peringatan. Setiap kombinasi nilai label |
|
ResourceCount |
AlertManagerDefinitionSizeBytes |
|
Ukuran maksimum file definisi manajer peringatan, dalam byte. |
|
ResourceCount |
AllSilences |
|
Jumlah maksimum keheningan, termasuk keheningan yang kedaluwarsa, aktif, dan tertunda, per ruang kerja. |
|
ResourceCount |
IngestionRate |
|
Tingkat konsumsi sampel Unit: Hitung per detik Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
RuleEvaluationInterval |
|
Interval evaluasi aturan minimum |
|
ResourceCount |
RuleGroupNamespaceDefinitionSizeBytes |
|
Ukuran maksimum file definisi namespace grup aturan, dalam byte. |
|
ResourceCount |
TemplatesInAlertManagerDefinition |
|
Jumlah maksimum template dalam file definisi manajer peringatan. |
|
ResourceCount |
WorkspaceCount |
|
Jumlah maksimum ruang kerja per Wilayah, per akuntc. |
|
ResourceCount |
SizeOfAlerts |
|
Ukuran total semua peringatan di ruang kerja, dalam byte Unit: Byte Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
SuppressedAlerts |
|
Jumlah peringatan dalam keadaan ditekan per ruang kerja. Peringatan dapat ditekan oleh keheningan atau penghambatan. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
UnprocessedAlerts |
|
Jumlah peringatan dalam keadaan belum diproses per ruang kerja. Peringatan dalam keadaan belum diproses setelah diterima oleh AlertManager, tetapi sedang menunggu evaluasi grup agregasi berikutnya. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
AllAlerts |
|
Jumlah peringatan di setiap negara bagian per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
AllRules |
|
Jumlah aturan di setiap negara bagian per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
NativeHistogramActiveSeries |
|
Jumlah seri aktif histogram asli yang unik per ruang kerja Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
ResourceCount |
NativeHistogramIngestionRate |
|
Tingkat konsumsi sampel histogram asli per ruang kerja per detik Unit: Hitung per detik Statistik yang Valid: Rata-rata, Minimum, Maksimum |
ActiveSeriesPerLabelSet |
- |
|
Penggunaan seri aktif saat ini untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
ActiveSeriesLimitPerLabelSet |
- |
|
Nilai batas seri aktif saat ini untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerAlertsReceived |
- |
|
Total lansiran yang berhasil diterima oleh manajer peringatan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerNotificationsFailed |
- |
|
Jumlah pengiriman peringatan yang gagal Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AlertManagerNotificationsThrottled |
- |
|
Jumlah peringatan yang dibatasi Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectors |
WorkspaceId |
|
Jumlah total detektor anomali untuk ruang kerja tertentu Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
AnomalyDetectorEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Jumlah total evaluasi detektor anomali Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorEvaluationFailures |
WorkspaceId, AnomalyDetectorId |
|
Jumlah kegagalan detektor anomali dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorLastEvaluationDuration |
WorkspaceId, AnomalyDetectorId |
|
Durasi evaluasi terakhir detektor anomali Unit: detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
AnomalyDetectorMissedEvaluations |
WorkspaceId, AnomalyDetectorId |
|
Jumlah evaluasi detektor anomali yang terlewat dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSamples** |
- |
|
Jumlah sampel yang dibuang dengan alasan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSeries** |
- |
|
Jumlah seri yang berisi sampel yang dibuang dengan alasan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSamplesPerLabelSet |
- |
|
Jumlah sampel yang dibuang untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
DiscardedSeriesPerLabelSet |
- |
|
Jumlah seri yang berisi sampel yang dibuang untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
IngestionRatePerLabelSet |
- |
|
Tingkat konsumsi untuk setiap set label yang ditentukan pengguna Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
NativeHistogramIngestedBucketsRate |
- |
|
Tingkat ember berpenduduk yang diterima per detik di semua sampel histogram asli. Tidak termasuk ember yang ditolak. Unit: Hitung per detik Statistik yang Valid: Rata-rata, Minimum, Maksimum |
|
NativeHistogramReducedResolutionCount |
- |
|
Hitungan sampel histogram asli dengan resolusi bucket yang dikurangi secara otomatis. Resolusi berkurang ketika sampel melebihi batas jumlah bucket maksimum. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
OutOfOrderIngestionRate |
- |
|
Out-of-order tingkat konsumsi sampel Unit: Hitung per detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
OutOfOrderSampleAge*** |
- |
|
Perbedaan antara stempel waktu sampel yang tidak sesuai pesanan dan waktu konsumsinya, yang menunjukkan berapa usia sampel saat dicerna. Unit: detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
QuerySamplesProcessed |
- |
|
Jumlah sampel kueri yang diproses Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleEvaluations |
- |
|
Jumlah total evaluasi aturan Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleEvaluationFailures |
- |
|
Jumlah kegagalan evaluasi aturan dalam interval Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleGroupIterationsMissed |
- |
|
Jumlah iterasi Grup Aturan yang terlewatkan dalam interval. Unit: Hitungan Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
|
RuleGroupLastEvaluationDuration |
- |
|
Durasi evaluasi terakhir kelompok aturan. Unit: detik Statistik yang Valid: Rata-rata, Minimum, Maksimum, Jumlah |
* Metrik TPS dihasilkan setiap menit dan merupakan rata-rata per detik selama menit itu. Periode burst pendek tidak akan ditangkap dalam metrik TPS.
** Beberapa alasan yang menyebabkan sampel dibuang adalah sebagai berikut. Tidak semua alasan di bawah ini muncul dalam DiscardedSeries metrik.
|
Alasan |
Arti |
|---|---|
|
greater_than_max_sample_age |
Membuang sampel yang lebih tua dari satu jam. |
|
baru-nilai-untuk-stempel waktu |
Sampel duplikat dikirim dengan stempel waktu yang sama dengan sampel sebelumnya tetapi dengan nilai yang berbeda. |
|
per_labelset_series_limit |
Pengguna telah mencapai jumlah total seri aktif per batas yang ditetapkan label. |
|
per_metric_series_limit |
Pengguna telah mencapai seri aktif per batas metrik. |
|
per_user_series_limit |
Pengguna telah mencapai jumlah total batas seri aktif. |
|
rate_limited |
Tingkat konsumsi terbatas. |
|
sampel-out-of-order |
Sampel dikirim rusak dan tidak dapat diproses. |
|
sampel-terlalu tua |
Sampel lebih tua dari jendela waktu out-of-order yang dikonfigurasi dan tidak dapat diproses. |
|
batas tingkat di luar pesanan |
Out-of-order Batas tingkat konsumsi tercapai dan sampel tidak dapat diproses. Untuk informasi selengkapnya, lihat Layanan Terkelola Amazon untuk kuota layanan Prometheus. |
|
label_value_too_long |
Nilai label lebih panjang dari batas karakter yang diizinkan. |
|
max_label_names_per_series |
Pengguna telah menekan nama label per metrik. |
|
hilang_metric_name |
Nama metrik tidak disediakan. |
|
metric_name_invalid |
Nama metrik yang diberikan tidak valid. |
|
label_invalid |
Label tidak valid disediakan. |
|
duplikate_label_names |
Nama label duplikat disediakan. |
|
native_histogram_sample_size_bytes_exceeded |
Sampel histogram asli melebihi ukuran sampel maksimum yang diizinkan dalam byte. |
|
native_histogram_invalid_schema |
Histogram asli memiliki nilai skema yang tidak valid. Skema yang valid berkisar dari -4 hingga 8. |
|
native_histogram_invalid |
Histogram asli gagal validasi (misalnya, jumlah bucket negatif, jumlah bucket yang tidak cocok, atau rentang bucket yang salah). |
|
native_histogram_buckets_exceeded |
Histogram asli melebihi batas jumlah bucket maksimum dan resolusi tidak dapat dikurangi secara otomatis. |
|
native_histogram_rate_limited |
Sampel histogram asli ditolak karena batas tingkat konsumsi histogram asli tercapai. |
|
per_user_native_histogram_series_limit |
Pengguna telah mencapai batas seri aktif histogram asli per ruang kerja. |
*** OutOfOrderSampleAge Metrik mencakup Percentile dimensi. Anda dapat menggunakan metrik ini untuk menentukan jendela waktu di luar pesanan yang sesuai untuk ruang kerja Anda. Nilai yang valid untuk Percentile dimensi adalah sebagai berikut.
|
Persentil |
Deskripsi |
|---|---|
|
p50 |
Usia persentil ke-50 dari sampel yang tidak dipesan. |
|
p99 |
Usia persentil ke-99 dari sampel yang tidak dipesan. |
|
max |
Usia maksimum sampel yang tidak dipesan. |
catatan
Metrik yang tidak ada atau hilang sama dengan nilai metrik itu menjadi 0.
catatan
RuleGroupIterationsMissedRuleEvaluations,RuleEvaluationFailures,, dan RuleGroupLastEvaluationDuration memiliki RuleGroup dimensi struktur berikut:
RuleGroupNamespace;RuleGroup
Menyetel CloudWatch alarm pada metrik penjual Prometheus
Anda dapat memantau penggunaan sumber daya Prometheus menggunakan alarm. CloudWatch
Untuk mengatur alarm pada jumlah ActiveSeries di Prometheus
-
Pilih tab Graphed metrics dan gulir ke bawah ke label. ActiveSeries
Dalam tampilan metrik Grafik, hanya metrik yang saat ini sedang dicerna yang akan muncul.
-
Pilih ikon notifikasi di kolom Tindakan.
-
Di Tentukan metrik dan kondisi, masukkan kondisi ambang batas di bidang Nilai kondisi dan pilih Berikutnya.
-
Di Mengkonfigurasi tindakan, pilih topik SNS yang ada atau buat topik SNS baru untuk mengirim notifikasi.
-
Di Tambahkan nama dan deskripsi, tambahkan nama alarm dan deskripsi opsional.
-
Pilih Buat alarm.