Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Tahap 3: Periksa, adaptasi, dan iterasi
Setelah Anda menerapkan sistem observabilitas Anda, kami menyarankan Anda untuk terus meninjau, menilai, mempelajari, menyesuaikan, dan meningkatkan implementasi Anda. Anda dapat menggunakan Model Kematangan AWS Observabilitas
Menerapkan ulasan reguler
Observabilitas adalah proses berulang. Ini membutuhkan audit dan penilaian rutin dari komponen yang ada, dan perubahan dan peningkatan untuk mendorong perbaikan berkelanjutan. Kami menyarankan Anda melakukan tinjauan rutin untuk mengevaluasi kembali SLOs, mengingatkan ambang batas, dasbor, perincian metrik, kebijakan retensi, strategi pengambilan sampel, dan sebagainya untuk memastikan bahwa ini mendorong nilai bagi tim dan bisnis Anda. Dengan menghubungkan biaya observabilitas ke tim dan layanan tertentu, Anda dapat mengaktifkan keputusan berbasis data tentang cakupan dan alokasi sumber daya.
Di Amazon, kami melakukan Tinjauan Kesiapan Operasional mingguan (ORRs) untuk mengaudit proses tim dan postur observabilitas terhadap praktik terbaik. Ini adalah latihan non-pemblokiran yang sejalan dengan jumlah layanan dan frekuensi rilis di Amazon.
Bergantung pada ukuran organisasi Anda, Anda juga dapat memiliki daftar bisnis seperti biasa (BAU), di mana satu anggota dari setiap tim bertanggung jawab untuk melaporkan anomali dan tren, mengungkap yang tidak diketahui-tidak diketahui, menghapus instrumentasi dan peringatan yang tidak diinginkan, meningkatkan dasbor, dan memastikan bahwa solusi observabilitas terus bekerja untuk tim dan selaras dengan tujuan dan metrik keberhasilan tim. Ini juga bisa menjadi kesempatan untuk menilai kembali strategi peringatan agar lebih responsif, proaktif, dan lebih dekat dengan pengguna. Tujuan dengan ulasan ini adalah untuk menciptakan siklus yang berbudi luhur, seperti yang ditunjukkan dalam ilustrasi berikut, dan untuk meningkatkan kematangan kematangan postur observabilitas Anda, seperti yang dijelaskan dalam Model Kematangan AWS Observabilitas
Identifikasi buku pedoman yang paling sering diakses dan pertimbangkan untuk meningkatkan aplikasi Anda atau menambahkan lebih banyak instrumentasi. Identifikasi runbook yang paling sering dieksekusi dan pertimbangkan untuk mengotomatiskan runbook tersebut.
Pembelajaran dari ulasan ini juga dibagikan dengan regu observabilitas dan spesialis, untuk menyoroti peningkatan dalam program pusat dan platform observabilitas. Misalnya, tergantung pada frekuensi kejadian yang dipicu penerapan, Anda mungkin memutuskan untuk memprioritaskan peningkatan pipeline penerapan di atas komponen lainnya. Jika MTTR lebih tinggi karena celah pemantauan, Anda dapat memprioritaskan peningkatan platform observabilitas dan konfigurasinya.
Rayakan kemenangan
Bagikan kisah sukses dari tim yang menggunakan alat observabilitas. Misalnya, sorot keberhasilan tim yang menggunakan metrik observabilitas untuk menerapkan solusi alternatif yang lebih efisien dan mengarah pada latensi atau biaya yang lebih rendah. Mengkomunikasikan keberhasilan ini menggarisbawahi pentingnya observabilitas dan memotivasi tim lain untuk meningkatkan postur observabilitas mereka dan berusaha untuk kesuksesan yang sama.
Belajar dari Insiden
Lakukan latihan pasca-insiden tanpa kesalahan yang mirip dengan proses koreksi kesalahan (COE