Menerapkan ulasan reguler Rayakan kemenangan Belajar dari Insiden

Tahap 3: Periksa, adaptasi, dan iterasi

Setelah Anda menerapkan sistem observabilitas Anda, kami menyarankan Anda untuk terus meninjau, menilai, mempelajari, menyesuaikan, dan meningkatkan implementasi Anda. Anda dapat menggunakan Model Kematangan AWS Observabilitas sebagai alat untuk menilai kematangan implementasi Anda dan untuk mengidentifikasi dan memprioritaskan area untuk perbaikan.

Menerapkan ulasan reguler

Observabilitas adalah proses berulang. Ini membutuhkan audit dan penilaian rutin dari komponen yang ada, dan perubahan dan peningkatan untuk mendorong perbaikan berkelanjutan. Kami menyarankan Anda melakukan tinjauan rutin untuk mengevaluasi kembali SLOS, ambang peringatan, dasbor, perincian metrik, kebijakan retensi, strategi pengambilan sampel, dan sebagainya untuk memastikan bahwa ini mendorong nilai bagi tim dan bisnis Anda. Dengan menghubungkan biaya observabilitas ke tim dan layanan tertentu, Anda dapat mengaktifkan keputusan berbasis data tentang cakupan dan alokasi sumber daya.

Di Amazon, kami melakukan Tinjauan Kesiapan Operasional (ORR) mingguan untuk mengaudit proses tim dan postur observabilitas terhadap praktik terbaik. Ini adalah latihan non-pemblokiran yang selaras dengan jumlah layanan dan frekuensi rilis di Amazon.

Bergantung pada ukuran organisasi Anda, Anda juga dapat memiliki daftar bisnis seperti biasa (BAU), di mana satu anggota dari setiap tim bertanggung jawab untuk melaporkan anomali dan tren, mengungkap yang tidak diketahui-tidak diketahui, menghapus instrumentasi dan peringatan yang tidak diinginkan, meningkatkan dasbor, dan memastikan bahwa solusi observabilitas terus bekerja untuk tim dan selaras dengan tujuan dan metrik keberhasilan tim. Ini juga bisa menjadi kesempatan untuk menilai kembali strategi peringatan agar lebih responsif, proaktif, dan lebih dekat dengan pengguna. Tujuan dengan ulasan ini adalah untuk menciptakan siklus yang berbudi luhur, seperti yang ditunjukkan dalam ilustrasi berikut, dan untuk meningkatkan kematangan kematangan postur observabilitas Anda, seperti yang dijelaskan dalam Model Kematangan AWS Observabilitas.

Umpan balik dan siklus tinjauan dalam proses observabilitas berulang.

Identifikasi buku pedoman yang paling sering diakses dan pertimbangkan untuk meningkatkan aplikasi Anda atau menambahkan lebih banyak instrumentasi. Identifikasi runbook yang paling sering dieksekusi dan pertimbangkan untuk mengotomatiskan runbook tersebut.

Pembelajaran dari ulasan ini juga dibagikan dengan regu observabilitas dan spesialis, untuk menyoroti peningkatan dalam program pusat dan platform observabilitas. Misalnya, tergantung pada frekuensi kejadian yang dipicu penerapan, Anda mungkin memutuskan untuk memprioritaskan peningkatan pipeline penerapan di atas komponen lainnya. Jika MTTR lebih tinggi karena celah pemantauan, Anda dapat memprioritaskan peningkatan platform observabilitas dan konfigurasinya.

Rayakan kemenangan

Bagikan kisah sukses dari tim yang menggunakan alat observabilitas. Misalnya, sorot keberhasilan tim yang menggunakan metrik observabilitas untuk menerapkan solusi alternatif yang lebih efisien dan mengarah pada latensi atau biaya yang lebih rendah. Mengkomunikasikan keberhasilan ini menggarisbawahi pentingnya observabilitas dan memotivasi tim lain untuk meningkatkan postur observabilitas mereka dan berusaha untuk kesuksesan yang sama.

Belajar dari Insiden

Lakukan latihan pasca-insiden tanpa kesalahan yang mirip dengan proses koreksi kesalahan (COE) di Amazon untuk mengidentifikasi area untuk perbaikan dan untuk mencegah masalah di masa depan. Seperti halnya kemenangan, pembelajaran dari latihan ini dapat dibagikan secara luas dengan tim lain untuk memperkuat nilai observabilitas dan praktik terbaik.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Tahap 2: Menerapkan observabilitas

Langkah dan sumber daya selanjutnya