

# OPS 4. Bagaimana Anda mengimplementasikan observabilitas dalam beban kerja Anda?
<a name="ops-04"></a>

Implementasikan observabilitas dalam beban kerja Anda sehingga Anda dapat memahami statusnya dan membuat keputusan berbasis data berdasarkan persyaratan bisnis.

**Topics**
+ [OPS04-BP01 Identifikasikan indikator performa utama](ops_observability_identify_kpis.md)
+ [OPS04-BP02 Mengimplementasikan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Mengimplementasikan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Mengimplementasikan penelusuran terdistribusi](ops_observability_dist_trace.md)

# OPS04-BP01 Identifikasikan indikator performa utama
<a name="ops_observability_identify_kpis"></a>

 Untuk mengimplementasikan observabilitas dalam beban kerja, Anda memulainya dengan memahami statusnya dan mengambil keputusan berbasis data berdasarkan persyaratan bisnis. Salah satu cara paling efektif untuk memastikan keselarasan antara kegiatan pemantauan dan tujuan bisnis adalah dengan menentukan serta memantau indikator kinerja utama (KPI). 

 **Hasil yang diinginkan:** Praktik observabilitas yang efisien yang sangat selaras dengan tujuan bisnis, sehingga memastikan upaya pemantauan selalu memenuhi hasil bisnis yang nyata. 

 **Antipola umum:** 
+  KPI yang tidak ditentukan: Bekerja tanpa KPI yang jelas dapat menyebabkan terlalu banyak atau terlalu sedikit pemantauan, sehingga sinyal-sinyal vital menjadi terlewatkan. 
+  KPI statis: Tidak meninjau atau menyempurnakan KPI seiring perkembangan beban kerja atau tujuan bisnis. 
+  Ketidakselarasan: Berfokus pada metrik teknis yang tidak berkorelasi langsung dengan hasil bisnis atau yang lebih sulit untuk berkorelasi dengan masalah dunia nyata. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Kemudahan identifikasi masalah: KPI bisnis sering memunculkan masalah secara lebih jelas daripada metrik teknis. Pengamatan pada KPI bisnis dapat mengenali masalah dengan lebih efektif daripada memilah-milah banyak metrik teknis. 
+  Keselarasan bisnis: Memastikan bahwa kegiatan pemantauan secara langsung mendukung tujuan bisnis. 
+  Efisiensi: Prioritaskan pemantauan sumber daya dan perhatian pada metrik yang penting. 
+  Proaktif: Kenali dan atasi masalah sebelum memunculkan dampak bisnis yang lebih luas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk menentukan KPI beban kerja secara efektif: 

1.  **Mulailah dengan hasil bisnis:** Sebelum menyelami metrik, pahami dahulu hasil bisnis yang diinginkan. Apakah peningkatan penjualan, keterlibatan pengguna yang lebih tinggi, atau waktu respons yang lebih cepat? 

1.  **Korelasikan metrik teknis dengan tujuan bisnis:** Tidak semua metrik teknis memiliki dampak langsung terhadap hasil bisnis. Identifikasikan metrik yang berdampak langsung terhadap hasil bisnis, tetapi sering kali lebih mudah mengidentifikasi masalah menggunakan KPI bisnis. 

1.  **Gunakan [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html):** Gunakan CloudWatch untuk menentukan dan memantau metrik yang mewakili KPI Anda. 

1.  **Tinjau dan perbarui KPI secara rutin:** Saat beban kerja dan bisnis Anda berkembang, jaga agar KPI Anda tetap relevan. 

1.  **Libatkan pemangku kepentingan:** Libatkan tim teknis dan bisnis dalam menentukan dan meninjau KPI. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+ [OPS04-BP02 Mengimplementasikan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Mengimplementasikan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Mengimplementasikan penelusuran terdistribusi](ops_observability_dist_trace.md)

 **Dokumen terkait:** 
+ [ Praktik Terbaik Observabilitas AWS](https://aws-observability.github.io/observability-best-practices/)
+ [ Panduan Pengguna CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [ Kursus Skill Builder Observabilitas AWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability)

 **Video terkait:** 
+ [ Mengembangkan strategi observabilitas ](https://www.youtube.com/watch?v=Ub3ATriFapQ)

 **Contoh terkait:** 
+  [Lokakarya One Observability](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Mengimplementasikan telemetri aplikasi
<a name="ops_observability_application_telemetry"></a>

 Telemetri aplikasi berfungsi sebagai fondasi observabilitas beban kerja Anda. Sangat penting menghadirkan telemetri yang menawarkan wawasan yang dapat ditindaklanjuti tentang keadaan aplikasi Anda serta pencapaian hasil teknis dan bisnis. Dari pemecahan masalah hingga pengukuran dampak fitur baru atau memastikan keselarasan dengan indikator kinerja utama (KPI) bisnis, telemetri aplikasi menjadi patokan bagi cara Anda membangun, mengoperasikan, dan mengembangkan beban kerja Anda. 

 Metrik, log, dan jejak merupakan tiga pilar utama observabilitas. Ketiganya berfungsi sebagai alat diagnostik yang menggambarkan keadaan aplikasi Anda. Seiring waktu, tiga hal ini membantu menciptakan garis acuan dan mengidentifikasi anomali. Namun, untuk memastikan keselarasan antara aktivitas pemantauan dan tujuan bisnis, KPI harus ditentukan dan dipantau. KPI bisnis sering kali mempermudah identifikasi masalah dibandingkan dengan metrik teknis saja. 

 Jenis telemetri lainnya, seperti pemantauan pengguna nyata (RUM) dan transaksi sintetis, melengkapi sumber-sumber data primer ini. RUM menawarkan wawasan tentang interaksi pengguna waktu nyata, sedangkan transaksi sintetis menyimulasikan perilaku pengguna potensial, sehingga membantu mendeteksi kemacetan sebelum pengguna nyata mengalaminya. 

 **Hasil yang diinginkan:** Dapatkan wawasan yang dapat ditindaklanjuti tentang performa beban kerja Anda. Wawasan ini memungkinkan Anda mengambil keputusan proaktif tentang optimisasi performa, mencapai peningkatan stabilitas beban kerja, merampingkan proses CI/CD, dan memanfaatkan sumber daya secara efektif. 

 **Antipola umum:** 
+  **Observabilitas yang tidak lengkap:** Mengabaikan penggunaan observabilitas di setiap lapisan beban kerja, sehingga mengakibatkan titik buta yang dapat mengaburkan performa sistem vital dan wawasan perilaku. 
+  **Tampilan data terfragmentasi:** Ketika data tersebar di beberapa alat dan sistem, mempertahankan pandangan yang menyeluruh tentang kondisi dan performa beban kerja Anda menjadi sulit dilakukan. 
+  **Masalah yang dilaporkan pengguna:** Tanda kurangnya deteksi masalah yang proaktif melalui telemetri dan pemantauan KPI bisnis. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Pengambilan keputusan berbasis informasi:** Dengan wawasan dari telemetri dan KPI bisnis, Anda dapat mengambil keputusan berbasis data. 
+  **Peningkatan efisiensi operasional:** Pemanfaatan sumber daya berbasis data menghasilkan efektivitas biaya. 
+  **Penyempurnaan stabilitas beban kerja:** Deteksi dan penyelesaian masalah yang lebih cepat yang menghasilkan peningkatan waktu aktif. 
+  **Perampingan proses CI/CD:** Wawasan dari data telemetri memfasilitasi penyempurnaan proses dan pengiriman kode yang andal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk mengimplementasikan telemetri untuk beban kerja Anda, gunakan layanan AWS seperti [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) dan [AWS X-Ray](https://aws.amazon.com/xray/). Amazon CloudWatch menyediakan rangkaian alat pemantauan yang komprehensif, sehingga Anda dapat mengamati sumber daya dan aplikasi Anda di lingkungan AWS dan on-premise. Layanan ini mengumpulkan, melacak, dan menganalisis metrik, menggabungkan dan memantau data log, dan merespons perubahan dalam sumber daya Anda, menyempurnakan pemahaman Anda tentang bagaimana beban kerja Anda beroperasi. Secara bersamaan, AWS X-Ray memungkinkan Anda melacak, menganalisis, dan men-debug aplikasi Anda, sehingga memberi Anda pemahaman yang mendalam tentang perilaku beban kerja Anda. Dengan fitur seperti peta layanan, distribusi latensi, dan lini waktu penelusuran, AWS X-Ray memberikan wawasan tentang performa beban kerja Anda dan hambatan yang memengaruhinya. 

### Langkah implementasi
<a name="implementation-steps"></a>

1.  **Identifikasi data apa yang perlu dikumpulkan:** Pastikan metrik, log, dan jejak penting yang akan menawarkan wawasan substansial tentang kondisi, performa, dan perilaku beban kerja Anda. 

1.  **Lakukan deployment [agen CloudWatch](https://aws.amazon.com/cloudwatch/): **Agen CloudWatch berperan penting dalam penyediaan metrik dan log sistem serta aplikasi dari beban kerja Anda dan infrastruktur yang mendasarinya. Agen CloudWatch juga dapat digunakan untuk mengumpulkan OpenTelemetry atau jejak X-Ray dan mengirimkannya ke X-Ray. 

1.  **Implementasikan deteksi anomali untuk log dan metrik:** Gunakan [deteksi anomali CloudWatch Logs](https://docs.aws.amazon.com/Amazon/latest/logs/LogsAnomalyDetection.html) dan [deteksi anomali Metrik CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/_Anomaly_Detection.html) untuk secara otomatis mengidentifikasi aktivitas yang tidak biasa dalam operasi aplikasi Anda. Alat-alat ini menggunakan algoritma machine learning untuk mendeteksi dan memberikan peringatan tentang anomali, yang meningkatkan kemampuan pemantauan Anda dan mempercepat waktu respons terhadap potensi gangguan atau ancaman keamanan. Siapkan fitur-fitur ini untuk mengelola kesehatan dan keamanan aplikasi secara proaktif. 

1.  **Amankan data log sensitif:** Gunakan [perlindungan data Amazon CloudWatch Logs](https://docs.aws.amazon.com/Amazon/latest/logs/mask-sensitive-log-data.html) untuk mengaburkan informasi sensitif dalam log Anda. Fitur ini membantu menjaga privasi dan kepatuhan melalui deteksi otomatis dan pengaburan data sensitif sebelum diakses. Implementasikan pengaburan data untuk menangani dan melindungi detail sensitif seperti informasi pengenal pribadi (PII) dengan aman. 

1.  **Tentukan dan pantau KPI bisnis:** Tetapkan [metrik kustom](https://docs.aws.amazon.com/Amazon/latest/monitoring/publishingMetrics.html) yang selaras dengan [hasil bisnis](https://aws-observability.github.io/observability-best-practices/guides/operational/business/monitoring-for-business-outcomes/) Anda. 

1.  **Instrumentasikan aplikasi Anda dengan AWS X-Ray:** Selain melakukan deployment agen CloudWatch, penting untuk [menginstrumentasikan aplikasi Anda](https://docs.aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html) agar memancarkan data jejak. Proses ini dapat memberikan wawasan lebih lanjut tentang perilaku dan performa beban kerja Anda. 

1.  **Lakukan standardisasi pengumpulan data di seluruh aplikasi Anda:** Lakukan standardisasi praktik pengumpulan data di seluruh aplikasi Anda. Keseragaman bermanfaat dalam mengorelasikan dan menganalisis data, sehingga memberikan pandangan yang komprehensif tentang perilaku aplikasi Anda. 

1.  **Implementasikan observabilitas lintas akun:** Tingkatkan efisiensi pemantauan di banyak Akun AWS dengan [observabilitas lintas akun Amazon CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/-Unified-Cross-Account.html). Dengan fitur ini, Anda dapat mengonsolidasikan metrik, log, dan alarm dari akun yang berbeda-beda ke dalam satu tampilan, sehingga menyederhanakan manajemen dan mempercepat waktu respons untuk masalah yang teridentifikasi di seluruh lingkungan AWS organisasi Anda. 

1.  **Analisis dan bertindaklah berdasarkan data:** Setelah pengumpulan dan normalisasi data dilakukan, gunakan [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) untuk analisis metrik dan log, dan [AWS X-Ray](https://aws.amazon.com/xray/features/) untuk analisis jejak. Analisis tersebut dapat menghasilkan wawasan penting tentang kondisi, performa, dan perilaku beban kerja Anda, sehingga memandu proses pengambilan keputusan Anda. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS04-BP01 Menetapkan KPI beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html) 
+  [OPS04-BP05 Mengimplementasikan keterlacakan transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 

 **Dokumen terkait:** 
+  [Praktik Terbaik Observabilitas AWS](https://aws-observability.github.io/observability-best-practices/) 
+  [Panduan Pengguna CloudWatch](https://docs.aws.amazon.com/Amazon/latest/monitoring/WhatIs.html) 
+  [Panduan Developer AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Menginstrumentasi sistem terdistribusi untuk visibilitas pengoperasian](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility) 
+  [Kursus Skill Builder Observabilitas AWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability) 
+  [Apa yang Baru dengan Amazon CloudWatch](https://aws.amazon.com/about-aws/whats-new/management-and-governance/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23amazon-cloudwatch) 
+  [Apa yang baru dengan AWS X-Ray](https://aws.amazon.com/about-aws/whats-new/developer-tools/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23aws-x-ray) 

 **Video terkait:** 
+  [AWS re:Invent 2022 - Observability best practices at Amazon](https://youtu.be/zZPzXEBW4P8) 
+  [AWS re:Invent 2022 - Developing an observability strategy](https://youtu.be/Ub3ATriFapQ) 

 **Contoh terkait:** 
+  [Lokakarya One Observability](https://catalog.workshops.aws/observability) 
+  [Pustaka Solusi AWS: Pemantauan Aplikasi dengan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch) 

# OPS04-BP03 Mengimplementasikan telemetri pengalaman pengguna
<a name="ops_observability_customer_telemetry"></a>

 Memperoleh wawasan yang mendalam tentang pengalaman dan interaksi pelanggan dengan aplikasi Anda adalah hal krusial. Pemantauan pengguna nyata (RUM) dan transaksi sintetis menjadi alat yang ampuh untuk tujuan ini. RUM menyediakan data tentang interaksi pengguna nyata yang memberikan perspektif kepuasan pengguna tanpa filter, sementara transaksi sintetis mensimulasikan interaksi pengguna, sehingga membantu mendeteksi potensi masalah bahkan sebelum berdampak pada pengguna nyata. 

 **Hasil yang diinginkan:** Pandangan yang menyeluruh tentang pengalaman pelanggan, deteksi masalah yang proaktif, dan optimalisasi interaksi pengguna untuk memberikan pengalaman digital yang mulus. 

 **Antipola umum:** 
+  Aplikasi tanpa pemantauan pengguna nyata (RUM): 
  +  Deteksi masalah yang tertunda: Tanpa RUM, Anda mungkin tidak menyadari kemacetan atau masalah performa sampai pengguna mengeluh. Pendekatan reaktif ini dapat menyebabkan ketidakpuasan pelanggan. 
  +  Tidak adanya wawasan pengalaman pengguna: Tanpa menggunakan RUM, Anda kehilangan data penting yang menunjukkan bagaimana pengguna nyata berinteraksi dengan aplikasi Anda, sehingga membatasi kemampuan Anda untuk mengoptimalkan pengalaman pengguna. 
+  Aplikasi tanpa transaksi sintetis: 
  +  Kasus edge yang terlewatkan: Transaksi sintetis membantu Anda menguji jalur dan fungsi yang mungkin tidak sering digunakan oleh pengguna biasa tetapi sangat penting untuk fungsi bisnis tertentu. Tanpanya, jalur-jalur tersebut bisa mengalami kesalahan fungsi dan luput dari perhatian. 
  +  Memeriksa masalah saat aplikasi tidak digunakan: Pengujian sintetis rutin dapat mensimulasikan saat-saat ketika pengguna nyata tidak berinteraksi secara aktif dengan aplikasi Anda, sehingga memastikan sistem selalu berfungsi dengan benar. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Deteksi masalah proaktif: Identifikasikan dan atasi potensi masalah sebelum berdampak pada pengguna nyata. 
+  Pengalaman pengguna yang dioptimalkan: Umpan balik yang berkelanjutan dari RUM membantu menyempurnakan dan meningkatkan pengalaman pengguna secara keseluruhan. 
+  Wawasan tentang performa perangkat dan browser: Memahami performa aplikasi Anda di berbagai perangkat dan browser, sehingga memungkinkan pengoptimalan lebih lanjut. 
+  Alur kerja bisnis yang divalidasi: Transaksi sintetis yang rutin memastikan fungsionalitas inti dan jalur-jalur kritis tetap berjalan dan efisien. 
+  Performa aplikasi yang ditingkatkan: Manfaatkan wawasan yang dikumpulkan dari data pengguna nyata untuk meningkatkan responsivitas dan keandalan aplikasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk memanfaatkan RUM dan transaksi sintetis untuk telemetri aktivitas pengguna, AWS menawarkan layanan seperti [Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) dan [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html). Metrik, log, dan jejak, ditambah dengan data aktivitas pengguna, memberikan pandangan yang komprehensif tentang status operasional aplikasi dan pengalaman pengguna. 

### Langkah implementasi
<a name="implementation-steps"></a>

1.  **Lakukan deployment Amazon CloudWatch RUM:** Integrasikan aplikasi Anda dengan CloudWatch RUM untuk mengumpulkan, menganalisis, dan menyajikan data pengguna nyata. 

   1.  Gunakan [perpustakaan JavaScript CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) untuk mengintegrasikan RUM dengan aplikasi Anda. 

   1.  Siapkan dasbor untuk memvisualisasikan dan memantau data pengguna nyata. 

1.  **Konfigurasikan CloudWatch Synthetics:** Buat canary, atau rutinitas terprogram, yang mensimulasikan interaksi pengguna dengan aplikasi Anda. 

   1.  Tentukan alur kerja dan jalur aplikasi kritis. 

   1.  Rancang canary menggunakan [skrip CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) untuk mensimulasikan interaksi pengguna untuk jalur-jalur tersebut. 

   1.  Jadwalkan dan pantau canary agar berjalan pada interval tertentu, sehingga memastikan pemeriksaan performa yang konsisten. 

1.  **Analisis dan tindak lanjuti data:** Manfaatkan data dari RUM dan transaksi sintetis untuk mendapatkan wawasan dan mengambil tindakan korektif ketika anomali terdeteksi. Gunakan dasbor dan alarm CloudWatch untuk tetap memutakhirkan informasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasikan indikator performa utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Mengimplementasikan penelusuran terdistribusi](ops_observability_dist_trace.md) 

 **Dokumen terkait:** 
+ [ Panduan Amazon CloudWatch RUM ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html)
+ [ Panduan Amazon CloudWatch Synthetics ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **Video terkait:** 
+ [ Mengoptimalkan aplikasi melalui wawasan pengguna akhir dengan RUM ](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+ [AWS on Air ft. Pemantauan Pengguna Nyata untuk Amazon CloudWatch ](https://www.youtube.com/watch?v=r6wFtozsiVE)

 **Contoh terkait:** 
+ [ Lokakarya One Observability ](https://catalog.workshops.aws/observability/en-US/intro)
+ [ Repositori Git untuk Klien Web Amazon CloudWatch RUM ](https://github.com/aws-observability/aws-rum-web)
+ [ Menggunakan Amazon CloudWatch Synthetics untuk mengukur waktu pemuatan halaman ](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance)

# OPS04-BP04 Mengimplementasikan telemetri dependensi
<a name="ops_observability_dependency_telemetry"></a>

 Telemetri dependensi sangat penting untuk memantau kondisi dan performa layanan dan komponen eksternal yang diandalkan oleh beban kerja Anda. Hal ini memberikan wawasan berharga tentang keterjangkauan, batas waktu, dan peristiwa penting lainnya yang terkait dengan dependensi seperti DNS, basis data, atau API pihak ketiga. Ketika Anda menginstrumentasi aplikasi Anda agar menghasilkan metrik, log, dan jejak tentang dependensi ini, Anda mendapatkan pemahaman yang lebih jelas tentang potensi kemacetan, masalah performa, atau kegagalan yang dapat memengaruhi beban kerja Anda. 

 **Hasil yang diinginkan:** Pastikan dependensi yang diandalkan beban kerja Anda menunjukkan performa sesuai harapan, sehingga Anda dapat secara proaktif mengatasi masalah dan memastikan performa beban kerja yang optimal. 

 **Antipola umum:** 
+  **Mengabaikan dependensi eksternal:** Hanya berfokus pada metrik aplikasi internal sambil mengabaikan metrik yang berkaitan dengan dependensi eksternal. 
+  **Kurangnya pemantauan proaktif:** Menunggu masalah muncul alih-alih terus memantau kondisi dan performa dependensi. 
+  **Pemantauan model silo:** Menggunakan beberapa alat pemantauan yang berbeda-beda sehingga wawasan tentang kondisi dependensi menjadi terfragmentasi dan tidak konsisten. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Peningkatan keandalan beban kerja:** Dengan memastikan bahwa dependensi eksternal terus-menerus tersedia dan berkinerja optimal. 
+  **Deteksi dan penyelesaian masalah yang lebih cepat:** Secara proaktif mengidentifikasi dan menangani masalah pada dependensi sebelum berdampak pada beban kerja. 
+  **Pandangan menyeluruh:** Mendapatkan pandangan yang menyeluruh tentang komponen internal dan eksternal yang memengaruhi kondisi beban kerja. 
+  **Peningkatan skalabilitas beban kerja:** Dengan memahami batas skalabilitas dan karakteristik performa dependensi eksternal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Implementasikan telemetri dependensi dengan memulai dari identifikasi layanan, infrastruktur, dan proses yang digunakan oleh beban kerja Anda. Ukur seperti apa kondisi yang baik ketika dependensi berfungsi sesuai harapan, kemudian tentukan data apa yang akan diperlukan untuk mengukurnya. Dengan informasi tersebut, Anda dapat membuat dasbor dan peringatan yang memberikan wawasan kepada tim operasi Anda tentang status dependensi tersebut. Gunakan alat AWS untuk menemukan dan mengukur dampak ketika dependensi tidak dapat menunjukkan hasil sesuai kebutuhan. Selalu tinjau ulang strategi Anda agar memperhitungkan perubahan prioritas, sasaran, dan wawasan yang diperoleh. 

### Langkah implementasi
<a name="implementation-steps"></a>

 Untuk mengimplementasikan telemetri dependensi secara efektif: 

1.  **Identifikasi dependensi eksternal:** Lakukan kolaborasi dengan pemangku kepentingan untuk menentukan dependensi eksternal yang diandalkan oleh beban kerja Anda. Dependensi eksternal dapat mencakup layanan seperti basis data eksternal, API pihak ketiga, rute konektivitas jaringan ke lingkungan lain, dan layanan DNS. Langkah pertama menuju telemetri dependensi yang efektif adalah memiliki pemahaman yang menyeluruh tentang apa saja dependensi tersebut. 

1.  **Kembangkan strategi pemantauan:** Setelah Anda memiliki gambaran yang jelas tentang dependensi eksternal Anda, rancanglah strategi pemantauan yang disesuaikan dengan dependensi tersebut. Ini melibatkan pemahaman tingkat kekritisan setiap dependensi, perilaku yang diharapkan, dan perjanjian atau target tingkat layanan (SLA atau SLT) terkait. Siapkan peringatan proaktif untuk memberi tahu Anda tentang perubahan status atau penyimpangan performa. 

1.  **Gunakan [pemantauan jaringan](https://docs.aws.amazon.com/Amazon/latest/monitoring/-Network-Monitoring-Sections.html):** Gunakan [Monitor Internet](https://docs.aws.amazon.com/Amazon/latest/monitoring/-InternetMonitor.html) dan [Monitor Jaringan](https://docs.aws.amazon.com/Amazon/latest/monitoring/what-is-network-monitor.html), yang memberikan wawasan komprehensif tentang kondisi internet dan jaringan global. Alat-alat ini membantu Anda memahami dan merespons pemadaman, gangguan, atau penurunan kinerja yang memengaruhi dependensi eksternal Anda. 

1.  **Selalu dapatkan informasi terkini dengan [Dasbor AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health-dashboard/):** Layanan ini memberikan peringatan dan panduan remediasi ketika AWS mengalami peristiwa yang dapat memengaruhi layanan Anda. 

   1.  Pantau [peristiwa AWS Health dengan aturan Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html), atau integrasikan secara terprogram dengan API AWS Health untuk mengotomatiskan tindakan saat Anda menerima peristiwa AWS Health. Ini bisa berupa tindakan umum, seperti mengirimkan semua pesan peristiwa siklus hidup yang direncanakan ke antarmuka obrolan, atau tindakan tertentu, seperti inisiasi alur kerja di alat manajemen layanan IT. 

   1.  Jika Anda menggunakan AWS Organizations, [agregasikan peristiwa AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html) di seluruh akun. 

1.  **Instrumentasikan aplikasi Anda dengan [AWS X-Ray](https://aws.amazon.com/xray/):** AWS X-Ray memberikan wawasan tentang bagaimana performa aplikasi dan dependensi yang mendasarinya. Dengan melacak permintaan dari awal hingga akhir, Anda dapat mengidentifikasi kemacetan atau kegagalan dalam layanan eksternal atau komponen yang diandalkan oleh aplikasi Anda. 

1.  **Gunakan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** Layanan berbasis machine learning ini mengidentifikasi masalah operasional, memprediksi kapan masalah kritis mungkin terjadi, dan merekomendasikan tindakan spesifik yang harus diambil. Layanan ini sangat bermanfaat untuk mendapatkan wawasan tentang dependensi dan memastikan dependensi bukan sumber masalah operasional. 

1.  **Pantau secara rutin:** Terus pantau metrik dan log yang berkaitan dengan dependensi eksternal. Siapkan peringatan untuk perilaku tak terduga atau performa yang menurun. 

1.  **Lakukan validasi setelah perubahan:** Setiap kali ada pembaruan atau perubahan pada salah satu dependensi eksternal, lakukan validasi performa dan periksa keselarasannya dengan persyaratan aplikasi Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS04-BP01 Menetapkan KPI beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html) 
+  [OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP05 Mengimplementasikan keterlacakan transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 
+  [OP08-BP04 Membuat peringatan yang dapat ditindaklanjuti](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html) 

 **Dokumen terkait:** 
+  [Panduan Pengguna Dasbor Health Pribadi Amazon](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [Panduan Pengguna Monitor Internet AWS](https://docs.aws.amazon.com/Amazon/latest/monitoring/-InternetMonitor.html) 
+  [Panduan Developer AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Panduan Pengguna AWS DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Visibilitas tentang bagaimana masalah internet memengaruhi performa aplikasi](https://www.youtube.com/watch?v=Kuc_SG_aBgQ) 
+  [Pengantar Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY) 
+  [Mengelola peristiwa siklus hidup sumber daya dalam skala besar dengan AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA) 

 **Contoh terkait:** 
+  [Gaining operational insights with AIOps using Amazon DevOps Guru](https://catalog.us-east-1.prod.workshops.aws/workshops/f92df379-6add-4101-8b4b-38b788e1222b/en-US) 
+  [AWS Health Aware](https://github.com/aws-samples/aws-health-aware/) 
+  [Menggunakan Pemfilteran Berbasis Tag untuk Mengelola Pemantauan dan Peringatan AWS Health dalam Skala Besar](https://aws.amazon.com/blogs/mt/using-tag-based-filtering-to-manage-health-monitoring-and-alerting-at-scale/) 

# OPS04-BP05 Mengimplementasikan penelusuran terdistribusi
<a name="ops_observability_dist_trace"></a>

 Penelusuran terdistribusi menawarkan cara untuk memantau dan memvisualisasikan permintaan yang melintasi berbagai komponen sistem terdistribusi. Dengan menangkap data jejak dari berbagai sumber dan menganalisisnya dalam tampilan terpadu, tim dapat lebih memahami bagaimana permintaan mengalir, di mana kemacetan terjadi, dan di mana upaya pengoptimalan harus difokuskan. 

 **Hasil yang diinginkan:** Dapatkan tampilan menyeluruh permintaan yang mengalir melewati sistem terdistribusi Anda, sehingga memungkinkan debugging yang presisi, performa yang dioptimalkan, dan pengalaman pengguna yang lebih baik. 

 **Antipola umum:** 
+  Instrumentasi yang tidak konsisten: Tidak semua layanan dalam sistem terdistribusi diinstrumentasi untuk penelusuran. 
+  Mengabaikan latensi: Hanya berfokus pada kesalahan dan tidak mempertimbangkan latensi atau penurunan performa bertahap. 

 **Manfaat menjalankan praktik terbaik ini:** 
+ Gambaran umum sistem yang komprehensif: Memvisualisasikan seluruh jalur permintaan, dari masuk hingga keluar.
+  Debugging yang disempurnakan: Mengidentifikasi dengan cepat di mana kegagalan atau masalah performa terjadi. 
+  Pengalaman pengguna yang ditingkatkan: Memantau dan mengoptimalkan berdasarkan data pengguna aktual, memastikan sistem memenuhi tuntutan dunia nyata. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Mulailah dengan mengidentifikasi semua elemen beban kerja Anda yang memerlukan instrumentasi. Setelah semua komponen diperhitungkan, manfaatkan alat seperti AWS X-Ray dan OpenTelemetry untuk mengumpulkan data jejak untuk dianalisis dengan alat seperti X-Ray dan Amazon CloudWatch ServiceLens Map. Lakukan peninjauan rutin dengan developer, dan lengkapi diskusi tersebut dengan alat seperti Amazon DevOps Guru, Analitik X-Ray, dan Wawasan X-Ray untuk membantu mengungkap temuan yang lebih mendalam. Buat peringatan dari data jejak untuk memberi tahu kapan hasil, sebagaimana didefinisikan dalam rencana pemantauan beban kerja, mengandung risiko. 

### Langkah implementasi
<a name="implementation-steps"></a>

 Untuk mengimplementasikan penelusuran terdistribusi secara efektif: 

1.  **Adopsi [AWS X-Ray](https://aws.amazon.com/xray/):** Integrasikan X-Ray ke dalam aplikasi Anda untuk mendapatkan wawasan tentang perilakunya, memahami performanya, dan mengenali kemacetan. Manfaatkan Wawasan X-Ray untuk analisis jejak otomatis. 

1.  **Lengkapi layanan Anda:** Verifikasi bahwa setiap layanan, dari fungsi [AWS Lambda](https://aws.amazon.com/lambda/) hingga [instans EC2](https://aws.amazon.com/ec2/), mengirimkan data jejak. Makin banyak layanan yang Anda lengkapi, maka makin jelas tampilan yang menyeluruh. 

1.  **Sertakan [Pemantauan Pengguna Nyata CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) dan [pemantauan sintetis](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html):** Integrasikan Pemantauan Pengguna Nyata (RUM) dan pemantauan sintetis dengan X-Ray. Hal ini memungkinkan perekaman pengalaman pengguna dunia nyata dan simulasi interaksi pengguna untuk mengidentifikasi potensi masalah. 

1.  **Gunakan [agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html):** Agen ini dapat mengirimkan jejak dari X-Ray atau OpenTelemetry, sehingga meningkatkan kedalaman wawasan yang diperoleh. 

1.  **Gunakan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** DevOps Guru menggunakan data dari X-Ray, CloudWatch, AWS Config, dan AWS CloudTrail untuk memberikan rekomendasi yang dapat ditindaklanjuti. 

1.  **Lakukan analisis jejak:** Tinjau data jejak secara rutin untuk membedakan pola, anomali, atau kemacetan yang dapat memengaruhi performa aplikasi Anda. 

1.  **Siapkan peringatan:** Konfigurasikan alarm di [CloudWatch](https://aws.amazon.com/cloudwatch/) untuk pola yang tidak biasa atau latensi yang meluas, sehingga memungkinkan penanganan masalah secara proaktif. 

1.  **Peningkatan berkelanjutan:** Tinjau ulang strategi penelusuran Anda saat layanan ditambahkan atau dimodifikasi untuk menangkap semua titik data yang relevan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasikan indikator performa utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Mengimplementasikan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 

 **Dokumen terkait:** 
+ [ Panduan AWS X-Ray untuk Pengembang ](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)
+ [ Panduan Pengguna agen Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [ Panduan Pengguna Amazon DevOps Guru ](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

 **Video terkait:** 
+ [ Gunakan Wawasan AWS X-Ray](https://www.youtube.com/watch?v=tl8OWHl6jxw)
+ [AWS on Air ft. Observabilitas: Amazon CloudWatch dan AWS X-Ray](https://www.youtube.com/watch?v=qBDBnPkZ-KI)

 **Contoh terkait:** 
+ [ Menginstrumentasi Aplikasi Anda dengan AWS X-Ray](https://aws.amazon.com/getting-started/hands-on/distributed-tracing-with-xray/)