

# OPS 8 Bagaimana cara memahami kondisi beban kerja Anda?
<a name="ops-08"></a>

 Tetapkan, catat, dan analisis metrik beban kerja untuk mendapatkan visibilitas peristiwa beban kerja sehingga Anda dapat mengambil tindakan yang tepat. 

**Topics**
+ [OPS08-BP01 Identifikasi indikator performa utama](ops_workload_health_define_workload_kpis.md)
+ [OPS08-BP02 Menentukan metrik beban kerja](ops_workload_health_design_workload_metrics.md)
+ [OPS08-BP03 Mengumpulkan dan menganalisis metrik beban kerja](ops_workload_health_collect_analyze_workload_metrics.md)
+ [OPS08-BP04 Membuat dasar acuan metrik beban kerja](ops_workload_health_workload_metric_baselines.md)
+ [OPS08-BP05 Mempelajari pola aktivitas yang diharapkan untuk beban kerja](ops_workload_health_learn_workload_usage_patterns.md)
+ [OPS08-BP06 Memberikan pemberitahuan saat hasil beban kerja terpapar risiko](ops_workload_health_workload_outcome_alerts.md)
+ [OPS08-BP07 Memberikan peringatan saat anomali beban kerja terdeteksi](ops_workload_health_workload_anomaly_alerts.md)
+ [OPS08-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik](ops_workload_health_biz_level_view_workload.md)

# OPS08-BP01 Identifikasi indikator performa utama
<a name="ops_workload_health_define_workload_kpis"></a>

 Identifikasi indikator performa utama (KPI) berdasarkan hasil bisnis yang diinginkan (misalnya, tingkat pemesanan, tingkat retensi pelanggan, dan laba dibandingkan pengeluaran operasi) dan hasil pelanggan (misalnya, kepuasan pelanggan). Evaluasi KPI untuk menentukan kesuksesan beban kerja. 

 **Antipola umum:** 
+  Pimpinan bisnis bertanya kepada Anda seberapa keberhasilan beban kerja dalam memenuhi kebutuhan bisnis tetapi tidak memiliki kerangka acuan untuk menentukan keberhasilan. 
+  Anda tidak dapat menentukan apakah aplikasi komersial umum yang Anda operasikan untuk organisasi Anda menghemat biaya. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengidentifikasi indikator performa utama Anda dapat mencapai hasil bisnis sebagai pengujian kondisi dan kesuksesan beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Identifikasi indikator performa utama: Identifikasi indikator performa utama (KPI) berdasarkan hasil bisnis dan hasil pelanggan. Evaluasi KPI untuk menentukan kesuksesan beban kerja. 

# OPS08-BP02 Menentukan metrik beban kerja
<a name="ops_workload_health_design_workload_metrics"></a>

Tentukan metrik yang mengukur kondisi beban kerja. Kondisi beban kerja diukur dengan pencapaian hasil bisnis (KPI) dan status aplikasi dan komponen beban kerja. Contoh KPI yakni, keranjang belanja yang diabaikan, pesanan yang dibuat, biaya, harga, dan pengeluaran beban kerja yang dialokasikan. Walaupun Anda dapat mengumpulkan telemetri dari beberapa komponen, pilih subset yang memberikan wawasan tentang kondisi beban kerja secara keseluruhan. Sesuaikan metrik beban kerja seiring waktu sesuai perubahan kebutuhan bisnis. 

 **Hasil yang diinginkan:** 
+  Anda telah mengidentifikasi metrik yang memvalidasi pencapaian KPI yang mencerminkan hasil bisnis. 
+  Anda memiliki metrik yang menunjukkan tampilan konsisten atas kondisi beban kerja. 
+  Metrik beban kerja dievaluasi secara berkala seiring perubahan kebutuhan bisnis. 

 **Antipola umum:** 
+ Anda memantau semua aplikasi di beban kerja Anda tetapi tidak dapat menentukan apakah beban kerja Anda mencapai hasil bisnis.
+ Anda telah menentukan metrik beban kerja tetapi metrik tersebut tidak terkait dengan KPI bisnis apa pun.

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda dapat mengukur beban kerja Anda dibandingkan pencapaian hasil bisnis. 
+  Anda tahu apakah beban kerja Anda berada dalam kondisi bagus atau memerlukan intervensi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Tujuan praktik terbaik ini yaitu Anda dapat menjawab pertanyaan berikut: apakah beban kerja saya dalam kondisi bagus? Kondisi beban kerja ditentukan oleh pencapaian hasil bisnis dan status aplikasi dan komponen di beban kerja. Kerjakan secara mundur dari KPI bisnis untuk mengidentifikasi metrik. Identifikasi metrik utama dari komponen dan aplikasi. Tinjau metrik beban kerja secara berkala seiring perubahan kebutuhan bisnis. 

 **Contoh pelanggan** 

 Kondisi beban kerja ditentukan di AnyCompany Retail oleh sekumpulan metrik komponen dan aplikasi. Dimulai dengan KPI bisnis, mereka mengidentifikasi metrik seperti tingkat pesanan yang dapat menunjukkan bahwa mereka mencapai hasil bisnis. Mereka juga menyertakan metrik aplikasi utama seperti respons halaman dan metrik komponen seperti koneksi basis data terbuka. Setiap kuartal sekali, mereka mengevaluasi ulang metrik beban kerja untuk memastikan metrik masih valid dalam menentukan kondisi beban kerja. 

 **Langkah implementasi** 

1.  Dimulai dengan KPI bisnis, identifikasi metrik yang menunjukkan Anda mencapai hasil bisnis. Jika ada KPI yang tidak memiliki metrik, instrumentasikan beban kerja Anda dengan metrik tambahan untuk setiap KPI bisnis yang hilang. 

   1.  Anda dapat mempublikasikan metrik kustom dari aplikasi Anda ke [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html). 

   1.  [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) dapat mengumpulkan metrik dari aplikasi yang sudah ada dan digunakan untuk menambahkan metrik baru. 

   1.  Pelanggan dengan Enterprise Support dapat meminta [Lokakarya Membuat Strategi Pemantauan](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini akan membantu Anda membangun strategi observabilitas untuk beban kerja Anda. 

1.  Identifikasi metrik untuk aplikasi dan komponen di beban kerja Anda. Apa saja metrik utama yang menunjukkan kondisi komponen dan aplikasi secara individu? Aplikasi dan komponen dapat memberikan banyak metrik yang berbeda, tetapi pilih satu hingga tiga metrik utama yang menunjukkan kondisi secara keseluruhan. 

1.  Implementasikan mekanisme untuk mengevaluasi metrik beban kerja secara berkala. ketika KPI bisnis berubah, bekerja samalah dengan para pemangku kepentingan untuk memperbarui metrik beban kerja. Seiring evolusi aplikasi dan komponen beban kerja, sesuaikan metrik beban kerja Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Menambahkan metrik untuk KPI bisnis ke aplikasi dapat memerlukan upaya tingkat sedang. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS04-BP01 Mengimplementasikan telemetri aplikasi](ops_telemetry_application_telemetry.md) - Aplikasi Anda harus memberikan telemetri yang mendukung hasil bisnis. 
+  [OPS04-BP02 Mengimplementasikan dan mengonfigurasikan telemetri beban kerja](ops_telemetry_workload_telemetry.md) - Anda harus menginstrumentasikan beban kerja agar memberikan telemetri sebelum Anda dapat menentukan metrik beban kerja yang mendukung hasil bisnis. 
+  [OPS08-BP01 Identifikasi indikator performa utama](ops_workload_health_define_workload_kpis.md) - Anda harus mengidentifikasi indikator performa utama terlebih dulu sebelum memilih metrik beban kerja. 

 **Dokumen terkait:** 
+ [ Menambahkan metrik dan jejak ke aplikasi Anda di Amazon EKS dengan AWS Distro for OpenTelemetry, AWS X-Ray, dan Amazon CloudWatch ](https://aws.amazon.com/blogs/mt/adding-metrics-and-traces-to-your-application-on-amazon-eks-with-aws-distro-for-opentelemetry-aws-x-ray-and-amazon-cloudwatch/)
+ [artikel Menginstrumentasikan sistem terdistribusi untuk visibilitas operasional](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/)
+ [ Mengimplementasikan pemeriksaan kondisi ](https://aws.amazon.com/builders-library/implementing-health-checks/)
+ [Cara Efektif Memantau Aplikasi Anda](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [ Cara meningkatkan pemantauan metrik aplikasi kustom Anda menggunakan Amazon CloudWatch Agent ](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/)

 **Video terkait:** 
+ [AWS re:Invent 2020: Memantau layanan produksi di Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw)
+ [AWS re:Invent 2022 - Membangun aplikasi yang dapat diamati dengan OpenTelemetry (BOA310) ](https://www.youtube.com/watch?v=efk8XFJrW2c)
+ [ Cara Mudah Menyiapkan Pemantauan Aplikasi untuk Beban Kerja AWS Anda - AWS Online Tech Talks ](https://www.youtube.com/watch?v=LKCth30RqnA)
+ [ Menguasai Observabilitas Aplikasi Nirserver - AWS Online Tech Talks ](https://www.youtube.com/watch?v=CtsiXhiAUq8)

 **Contoh terkait:** 
+ [One Observability Workshop](https://catalog.workshops.aws/observability/en-US/intro)

 **Layanan terkait:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Distro for OpenTelemetry ](https://aws-otel.github.io/)

# OPS08-BP03 Mengumpulkan dan menganalisis metrik beban kerja
<a name="ops_workload_health_collect_analyze_workload_metrics"></a>

Lakukan peninjauan metrik beban kerja secara teratur dan proaktif untuk mengidentifikasi tren dan menentukan apakah respons diperlukan dan validasikan pencapaian hasil bisnis. Kumpulkan metrik dari komponen dan aplikasi beban kerja Anda di satu lokasi terpusat. Gunakan dasbor dan alat analitik untuk menganalisis telemetri dan menentukan kondisi beban kerja. Implementasikan mekanisme untuk secara berkala melakukan peninjauan kondisi beban kerja dengan para pemangku kepentingan di organisasi Anda. 

 **Hasil yang diinginkan:** 
+  Metrik beban kerja dikumpulkan di satu lokasi terpusat. 
+  Dasbor dan alat analitik digunakan untuk menganalisis tren kondisi beban kerja. 
+  Anda secara berkala melakukan peninjauan metrik beban kerja dengan organisasi Anda. 

 **Antipola umum:** 
+  Organisasi Anda mengumpulkan metrik dari beban kerja di dua platform observabilitas yang berbeda. Anda tidak dapat menentukan kondisi beban kerja karena platform tidak kompatibel. 
+  Tingkat kesalahan untuk komponen beban kerja Anda perlahan meningkat. Anda gagal melihat tren ini karena organisasi Anda tidak melakukan peninjauan metrik beban kerja secara berkala. Komponen gagal setelah satu minggu, sehingga mengganggu beban kerja. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda memiliki kesadaran yang lebih tinggi akan kondisi beban kerja dan pencapaian hasil bisnis. 
+  Tren kondisi beban kerja dapat dikembangkan seiring waktu. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Kumpulkan metrik beban kerja di satu lokasi terpusat. Menggunakan dasbor dan alat analitik, analisis metrik beban kerja untuk mendapatkan wawasan tentang kondisi beban kerja, mengembangkan tren kondisi beban kerja, dan memvalidasi pencapaian hasil bisnis. Implementasikan mekanisme untuk melakukan peninjauan metrik beban kerja secara berkala. 

 **Contoh pelanggan** 

 AnyCompany Retail melakukan peninjauan metrik beban kerja setiap minggu pada hari Rabu. Mereka mengumpulkan para pemangku kepentingan dari seluruh perusahaan dan membahas metrik minggu sebelumnya. Mereka menyorot tren dan wawasan yang diperoleh dari alat analitik selama rapat. Dasbor internal dipublikasikan dengan metrik beban kerja utama yang dapat dilihat dan dicari oleh semua karyawan. 

 **Langkah implementasi** 

1.  Identifikasi metrik beban kerja yang terikat dengan kondisi beban kerja. Dimulai dengan KPI bisnis, identifikasi metrik untuk aplikasi, komponen, dan platform yang memberikan tampilan kondisi beban kerja secara keseluruhan. 

   1.  Anda dapat mempublikasikan metrik kustom di [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html). Anda dapat memanfaatkan [ agen Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) untuk mengumpulkan metrik dan log dari instans Amazon EC2 dan server on-premise. 

   1.  [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) dapat mengumpulkan metrik dari aplikasi yang sudah ada dan digunakan untuk menambahkan metrik baru. 

   1.  Pelanggan dengan Enterprise Support dapat meminta [Lokakarya Membuat Strategi Pemantauan](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini membantu Anda membangun strategi observabilitas untuk beban kerja Anda. 

1.  Kumpulkan metrik beban kerja di satu platform terpusat. Jika metrik beban kerja dibagi antara berbagai platform yang berbeda, maka analisis dan pengembangan tren bisa sulit dilakukan. Platform harus memiliki kemampuan analitik dan dasbor. 

   1.  [Amazon CloudWatch](https://docs.aws.amazon.com/) dapat mengumpulkan dan menyimpan metrik beban kerja. Dalam topologi multi-akun, direkomendasikan untuk memiliki [akun pemantauan dan pencacatan terpusat](https://docs.aws.amazon.com/prescriptive-guidance/latest/security-reference-architecture/log-archive.html), yang disebut sebagai *akun arsip log*. 

1.  Bangun dasbor metrik beban kerja yang terkonsolidasi. Gunakan tampilan ini untuk peninjauan metrik dan analisis tren. 

   1.  Anda dapat membuat [dasbor CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) kustom untuk mengumpulkan metrik beban kerja Anda dalam tampilan yang terkonsolidasi. 

1.  Implementasikan proses peninjauan metrik beban kerja. Setiap minggu sekali, dua minggu sekali, atau sebulan sekali, tinjau metrik beban kerja Anda dengan para pemangku kepentingan, termasuk personel teknis dan non-teknis. Gunakan sesi peninjauan ini untuk mengidentifikasi tren dan mendapatkan wawasan tentang kondisi beban kerja. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Jika metrik beban kerja tidak dikumpulkan secara terpusat, metrik ini dapat memerlukan investasi yang cukup besar untuk mengonsolidasikannya di satu platform. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS08-BP01 Identifikasi indikator performa utama](ops_workload_health_define_workload_kpis.md) - Anda harus mengidentifikasi indikator performa utama terlebih dulu sebelum memilih metrik beban kerja. 
+  [OPS08-BP02 Menentukan metrik beban kerja](ops_workload_health_design_workload_metrics.md) - Anda harus menentukan metrik beban kerja sebelum mengumpulkan dan menganalisisnya. 

 **Dokumen terkait:** 
+ [ Wawasan operasional kuat denganAmazon Quick ](https://aws.amazon.com/blogs/big-data/power-operational-insights-with-amazon-quicksight/)
+ [ Menggunakan widget kustom dasbor Amazon CloudWatch ](https://aws.amazon.com/blogs/mt/introducing-amazon-cloudwatch-dashboards-custom-widgets/)

 **Video terkait:** 
+ [ Membuat Dasbor CloudWatch Lintas Akun & Lintas Wilayah ](https://www.youtube.com/watch?v=eIUZdaqColg)
+ [ Memantau Sumber Daya AWS Menggunakan Dasbor Amazon CloudWatch ](https://www.youtube.com/watch?v=I7EFLChc07M)

 **Contoh terkait:** 
+ [ Lokakarya Alat Manajemen dan Tata Kelola AWS - Dasbor CloudWatch ](https://mng.workshop.aws/operations-2022/detect/cwdashboard.html)
+ [ Well-Architected Labs - Tingkat 100: Memantau dengan Dasbor CloudWatch ](https://www.wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/)

 **Layanan terkait:** 
+  [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+ [AWS Distro for OpenTelemetry](https://aws-otel.github.io/)

# OPS08-BP04 Membuat dasar acuan metrik beban kerja
<a name="ops_workload_health_workload_metric_baselines"></a>

Membuat dasar acuan untuk metrik beban kerja membantu memahami performa dan kondisi beban kerja. Dengan menggunakan dasar acuan, Anda dapat mengidentifikasi komponen dan aplikasi dengan performa rendah dan performa tinggi. Dasar acuan beban kerja menambah kemampuan Anda untuk memitigasi masalah sebelum masalah menjadi insiden. Dasar acuan merupakan fondasi dalam mengembangkan pola aktivitas dan mengimplementasikan deteksi anomali ketika metrik menyimpang dari nilai yang diharapkan. 

 **Hasil yang diinginkan:** 
+  Anda memiliki tingkat metrik yang merupakan dasar acuan untuk beban kerja dalam kondisi normal. 
+  Anda dapat menentukan apakah beban kerja Anda berfungsi dengan normal. 

 **Antipola umum:** 
+  Setelah melakukan deployment fitur baru, latensi permintaan mengalami penurunan. Dasar acuan tidak dibuat untuk metrik komposit permintaan masuk yang diproses dan latensi secara keseluruhan. Anda tidak dapat menentukan apakah perubahan menghasilkan peningkatan atau menyebabkan kecacatan. 
+  Lonjakan mendadak dalam aktivitas pengguna terjadi, tetapi Anda belum menetapkan dasar acuan metrik. Aktivitas melonjak dengan perlahan sehingga mengakibatkan kebocoran memori dalam aplikasi. Pada akhirnya, hal ini membuat beban kerja Anda menjadi offline. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda memahami pola normal aktivitas untuk beban kerja Anda menggunakan metrik untuk aplikasi dan komponen utama. 
+  Anda dapat menentukan apakah beban kerja Anda, serta aplikasi dan komponennya, menunjukkan perilaku normal atau mungkin memerlukan intervensi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Gunakan data historis untuk membuat dasar acuan metrik beban kerja untuk aplikasi dan komponen di beban kerja Anda. Manfaatkan dasar acuan metrik dalam penyelesaian masalah dan rapat peninjauan metrik. Tinjau performa beban kerja secara berkala dan sesuaikan dasar acuan seiring evolusi arsitektur. 

 **Contoh pelanggan** 

 Dasar acuan dibuat untuk semua komponen dan aplikasi di AnyCompany Retail. Dengan menggunakan data historis, AnyCompany Retail mengembangkan dasar acuan metrik beban kerja selama jangka waktu metrik dua bulan. Setiap dua bulan, mereka menilai ulang dasar acuan dan menyesuaikannya berdasarkan data dunia nyata. 

 **Langkah implementasi** 

1.  Bekerja mundur dari metrik beban kerja Anda, buat dasar acuan metrik untuk aplikasi dan komponen utama menggunakan data historis. Batasi jumlah metrik per komponen atau aplikasi, dan hindari kejenuhan pemantauan. 

   1.  Anda dapat menggunakan [Wawasan Metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html) untuk melakukan kueri metrik dalam skala besar dan mengidentifikasi tren serta pola. 

   1.  [Deteksi anomali Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) menggunakan algoritme machine learning untuk mengidentifikasi pola perilaku untuk metrik, menentukan dasar acuan, dan memunculkan anomali. 

   1.  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) memberikan kemampuan untuk mendeteksi masalah operasional beban kerja Anda menggunakan machine learning. 

   1.  Pelanggan dengan Enterprise Support dapat meminta [Lokakarya Membuat Strategi Pemantauan](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini akan membantu Anda membangun strategi observabilitas untuk beban kerja Anda. 

1.  Sediakan mekanisme untuk meninjau dasar acuan metrik beban kerja secara berkala, terutama sebelum peristiwa bisnis yang besar. Minimal satu kali per kuartal, evaluasi dasar acuan beban kerja Anda menggunakan data historis. Gunakan dasar acuan dalam rapat peninjauan metrik. 

 **Tingkat upaya untuk rencana implementasi:** Rendah Memiliki metrik beban kerja dan dasar acuan dapat mewajibkan Anda untuk mengumpulkan cukup banyak data guna mengidentifikasi pola perilaku yang normal. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS08-BP02 Menentukan metrik beban kerja](ops_workload_health_design_workload_metrics.md) - Metrik beban kerja harus ditetapkan terlebih dulu sebelum menentukan dasar acuan. 
+  [OPS08-BP03 Mengumpulkan dan menganalisis metrik beban kerja](ops_workload_health_collect_analyze_workload_metrics.md) - Mengumpulkan dan menganalisis metrik beban kerja harus dilakukan sebelum membuat dasar acuan metrik. 
+  [OPS08-BP05 Mempelajari pola aktivitas yang diharapkan untuk beban kerja](ops_workload_health_learn_workload_usage_patterns.md) - Praktik terbaik ini dibuat berdasarkan dasar acuan untuk mengembangkan tren penggunaan. 
+  [OPS08-BP06 Memberikan pemberitahuan saat hasil beban kerja terpapar risiko](ops_workload_health_workload_outcome_alerts.md) - Dasar acuan metrik diperlukan untuk mengidentifikasi ambang batas dan mengembangkan peringatan. 
+  [OPS08-BP07 Memberikan peringatan saat anomali beban kerja terdeteksi](ops_workload_health_workload_anomaly_alerts.md) - Deteksi anomali memerlukan pembuatan dasar acuan metrik. 

 **Dokumen terkait:** 
+ [Praktik Terbaik Observabilitas AWS - Alarm ](https://aws-observability.github.io/observability-best-practices/tools/alarms/)
+ [Cara Efektif Memantau Aplikasi Anda](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/)
+ [ Cara menyiapkan Deteksi Anomali CloudWatch untuk menetapkan alarm dinamis, mengotomatiskan tindakan, dan mendorong penjualan online ](https://aws.amazon.com/blogs/mt/how-to-set-up-cloudwatch-anomaly-detection-to-set-dynamic-alarms-automate-actions-and-drive-online-sales/)
+ [ Mengoperasionalkan Deteksi Anomali CloudWatch ](https://aws.amazon.com/blogs/mt/operationalizing-cloudwatch-anomaly-detection/)

 **Video terkait:** 
+ [AWS re:Invent 2020: Memantau layanan produksi di Amazon ](https://www.youtube.com/watch?v=hnPcf_Czbvw)
+ [AWS re:Invent 2021- Mendapatkan wawasan dari metrik operasional dalam skala besar dengan Wawasan Metrik CloudWatch ](https://www.youtube.com/watch?v=xKib0xvbIfo)
+ [AWS re:Invent 2022 - Mengembangkan strategi observabilitas (COP302) ](https://www.youtube.com/watch?v=Ub3ATriFapQ)
+ [AWS Summit DC 2022 - Pemantauan dan observabilitas untuk aplikasi modern ](https://www.youtube.com/watch?v=AHiuyT0B5Gk)
+ [AWS Summit SF 2022 - Pemantauan aplikasi dan observabilitas tumpukan penuh dengan AWS (COP310) ](https://www.youtube.com/watch?v=or7uFFyHIX0)

 **Contoh terkait:** 
+ [ Lokakarya Integrasi AWS CloudTrail dan Amazon CloudWatch ](https://catalog.us-east-1.prod.workshops.aws/workshops/2e48b9fc-f721-4417-b811-962b7f31b61c/en-US)

 **Layanan terkait:** 
+ [ Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [ Amazon DevOps Guru ](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

# OPS08-BP05 Mempelajari pola aktivitas yang diharapkan untuk beban kerja
<a name="ops_workload_health_learn_workload_usage_patterns"></a>

 Buat pola aktivitas beban kerja untuk mengidentifikasi aktivitas anomali, sehingga Anda dapat memberikan respons yang sesuai jika diperlukan. 

 CloudWatch melalui [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) menerapkan algoritma machine learning dan statistik untuk membuat rentang nilai ekspektasi sesuai dengan perilaku metrik normal. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) dapat digunakan untuk mengidentifikasi perilaku anomali melalui korelasi peristiwa, analisis log, dan penerapan machine learning, untuk menganalisis telemetri beban kerja Anda. Saat terdeteksi perilaku yang tidak diharapkan, akan tersedia [peristiwa dan metrik terkait](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) serta saran untuk mengatasi perilaku tersebut. 

 **Antipola umum:** 
+  Anda sedang meninjau log pemanfaatan jaringan dan mendapati pemanfaatan jaringan yang meningkat antara pukul 11.30 dan 13.30, kemudian kembali terjadi pada pukul 16.30 hingga 18.00. Anda tidak tahu apakah kejadian ini harus dianggap normal atau tidak. 
+  Server web Anda melakukan boot ulang setiap pukul 03.00 dini hari. Anda tidak tahu apakah kejadian ini harus dianggap normal atau tidak. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mempelajari pola perilaku, Anda dapat mengenali perilaku yang tidak diharapkan dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pelajari pola aktivitas yang diharapkan untuk beban kerja: Tetapkan pola aktivitas beban kerja untuk menentukan perilaku yang menyimpang dari nilai ekspektasi agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 

# OPS08-BP06 Memberikan pemberitahuan saat hasil beban kerja terpapar risiko
<a name="ops_workload_health_workload_outcome_alerts"></a>

 Berikan pemberitahuan saat terdapat risiko pada hasil beban kerja sehingga Anda dapat merespons dengan tepat jika perlu. 

 Idealnya, sebelumnya Anda telah mengidentifikasi ambang batas metrik yang dapat diberitahukan atau peristiwa yang dapat digunakan untuk memicu respons otomatis. 

 Di AWS, Anda dapat menggunakan [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) untuk membuat skrip canary guna memantau titik akhir dan API Anda dengan melakukan tindakan yang sama seperti pelanggan Anda. Telemetri yang dihasilkan dan [wawasan yang didapatkan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_Details.html) dapat membantu Anda mengidentifikasi masalah sebelum pelanggan merasakan dampaknya. 

 Anda juga dapat menggunakan [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) untuk mencari dan menganalisis data log secara interaktif dengan menggunakan bahasa kueri yang dibuat khusus. CloudWatch Logs Insights secara otomatis [menemukan bidang dalam log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData-discoverable-fields.html) dari layanan AWS, dan log event kustom dalam format JSON. Ini menskalakan dengan volume log dan kompleksitas kueri dan memberi jawaban dalam hitungan detik, sehingga membantu Anda mencari faktor penyebab insiden. 

 **Antipola umum:** 
+  Anda tidak memiliki konektivitas jaringan. Tidak ada yang menyadarinya. Tidak ada orang yang mencoba mengidentifikasi alasannya maupun melakukan tindakan untuk memulihkan konektivitas. 
+  Setelah sebuah patch, instans persisten Anda tidak tersedia, sehingga pengguna menjadi terganggu. Pengguna Anda mengajukan kasus dukungan. Tidak ada yang menerima notifikasi. Tidak ada yang melakukan tindakan. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengidentifikasi bahwa terdapat risiko pada hasil bisnis dan memberitahukan tindakan yang perlu diambil, Anda memiliki peluang untuk mencegah atau memitigasi dampak insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Beritahukan saat terdapat risiko pada hasil beban kerja: Berikan pemberitahuan saat terdapat risiko pada hasil beban kerja sehingga Anda dapat merespons dengan tepat jika diperlukan. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP07 Memberikan peringatan saat anomali beban kerja terdeteksi
<a name="ops_workload_health_workload_anomaly_alerts"></a>

 Aktifkan peringatan saat anomali beban kerja terdeteksi, agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

 Analisis metrik beban kerja Anda dalam jangka waktu tertentu dapat membentuk pola perilaku yang dapat Anda ukur dengan memadai untuk menetapkan peristiwa atau memberikan alarm respons. 

 Setelah dilatih, fitur [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) dapat digunakan untuk [memberikan alarm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) terhadap anomali terdeteksi, atau menyediakan nilai ekspektasi overlay ke dalam sebuah [grafik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) data metrik untuk perbandingan berkelanjutan. 

 **Antipola umum:** 
+  Penjualan situs web retail Anda mengalami peningkatan signifikan secara tiba-tiba. Tidak ada yang menyadarinya. Tidak ada yang mencoba untuk mengidentifikasi penyebab lonjakan ini. Tidak ada yang melakukan tindakan untuk memastikan kualitas pengalaman pelanggan dengan beban tambahan tersebut. 
+  Dengan mengikuti penerapan patch, server tetap Anda akan sering melakukan boot ulang, hal ini dapat mengganggu pengguna. Server Anda biasanya melakukan boot ulang hingga tiga kali, tetapi tidak lebih dari itu. Tidak ada yang menyadarinya. Tidak ada yang mencoba mengidentifikasi apa yang terjadi. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami pola perilaku beban kerja, Anda dapat mengidentifikasi perilaku menyimpang dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Aktifkan peringatan saat anomali beban kerja terdeteksi: Berikan peringatan saat anomali beban kerja terdeteksi sehingga Anda dapat memberikan respons yang sesuai jika diperlukan. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik
<a name="ops_workload_health_biz_level_view_workload"></a>

 Buat tampilan tingkat bisnis mengenai operasi beban kerja Anda untuk membantu menentukan apakah Anda telah mencapai pemenuhan, serta mengidentifikasi area yang memerlukan pengembangan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 

 AWS juga mendukung alat kecerdasan bisnis dan sistem analisis log pihak ketiga melalui layanan API dan SDK AWS (misalnya, Grafana, Kibana, dan Logstash). 

 **Antipola umum:** 
+  Waktu respons halaman belum pernah dianggap berkontribusi pada kepuasan pelanggan. Anda belum pernah membuat metrik atau ambang batas untuk waktu respons halaman. Pelanggan Anda mengeluhkan kelambatan. 
+  Anda belum mencapai target waktu respons minimum Anda. Dalam upaya untuk meningkatkan waktu respons, Anda telah menaikkan skala server aplikasi Anda. Anda telah melampaui target waktu respons dengan margin yang signifikan dan mengeluarkan biaya untuk kapasitas tak terpakai yang signifikan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan meninjau dan merevisi KPI serta metrik, Anda memahami bagaimana beban kerja Anda mendukung pencapaian hasil bisnis Anda, serta dapat mengidentifikasi bagian yang memerlukan pengembangan untuk mencapai tujuan bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Validasikan pencapaian hasil dan efektivitas KPI serta metrik: Buat tampilan tingkat bisnis mengenai operasi beban kerja Anda untuk membantu menentukan apakah Anda telah mencapai pemenuhan, serta mengidentifikasi area yang memerlukan pengembangan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 
  +  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 