View a markdown version of this page

Pencegahan insiden proaktif - AWS DevOps Agen

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pencegahan insiden proaktif

AWS DevOps Agen menganalisis pola di seluruh investigasi insiden Anda untuk memberikan rekomendasi yang ditargetkan yang terus meningkatkan postur operasional Anda dan mencegah insiden di masa depan. Akses pencegahan insiden proaktif melalui halaman Ops Backlog di Aplikasi Web Operator.

Cara kerja pencegahan insiden proaktif

AWS DevOps Agen mengevaluasi investigasi insiden baru-baru ini untuk mengidentifikasi perbaikan jangka panjang untuk mencegah insiden future dan mempercepat mean time to detection (MTTD). Agen menganalisis beberapa insiden untuk mengidentifikasi rekomendasi yang dapat mencegah seluruh kelas insiden di masa depan, dengan fokus pada rekomendasi yang paling berdampak untuk memastikan mereka dapat ditindaklanjuti.

Secara default, agen secara otomatis menjalankan evaluasi setiap minggu. Anda dapat menjeda jadwal jika Anda lebih suka menjalankan evaluasi hanya sesuai permintaan. Evaluasi manual selalu tersedia, yang berguna ketika penyelidikan baru-baru ini menjamin perputaran cepat pada perbaikan yang direkomendasikan.

Agen mengidentifikasi peningkatan di empat kategori, yang ditunjukkan dalam bagan Kategorisasi Rekomendasi di halaman Backlog Ops:

  • Observabilitas — Rekomendasi untuk meningkatkan pemantauan, peringatan, pencatatan, dan visibilitas sistem untuk mendeteksi masalah lebih cepat dan lebih akurat.

  • Infrastruktur — Rekomendasi untuk mengoptimalkan konfigurasi sumber daya, penyetelan kapasitas, dan ketahanan arsitektur.

  • Tata Kelola — Rekomendasi untuk memperkuat proses penyebaran, perbaikan saluran pipa, praktik pengujian, dan kontrol operasional.

  • Pengoptimalan kode — Rekomendasi untuk meningkatkan kualitas kode aplikasi, penanganan kesalahan, dan ketahanan kode.

Kategorisasi ini membantu Anda memahami di mana peningkatan operasional Anda paling dibutuhkan dan memungkinkan Anda memprioritaskan rekomendasi berdasarkan area fokus tim Anda.

Manfaat

  • Mencegah insiden berulang — Mengatasi akar penyebab secara sistematis daripada berulang kali menanggapi jenis masalah yang sama

  • Kurangi kerja keras operasional — Bebaskan tim Anda dari pemadam kebakaran berulang untuk fokus pada inovasi dan peningkatan strategis

  • Meningkatkan ketahanan sistem — Memperkuat infrastruktur, observabilitas, dan proses penyebaran Anda berdasarkan data insiden nyata

  • Belajar dari pola historis — Manfaatkan wawasan dari insiden masa lalu untuk membuat perbaikan yang ditargetkan yang memiliki dampak terbesar

Ringkasan agen

Ringkasan Agen di halaman Ops Backlog dari Aplikasi Web memberikan deskripsi hasil dari evaluasi terakhir insiden baru-baru ini. Ringkasan tersebut menjelaskan jumlah investigasi insiden yang dianalisis, insiden mana yang mirip dengan yang sebelumnya, dan rekomendasi mana yang dibuat atau diperbarui dengan informasi baru.

Ringkasan ini membantu Anda dengan cepat memahami apa yang ditemukan agen selama evaluasi terbaru dan menyoroti rekomendasi paling penting yang dapat memiliki dampak terbesar pada postur operasional Anda.

Mengontrol evaluasi

Anda dapat mengontrol kapan AWS DevOps Agen mengevaluasi insiden dan menghasilkan rekomendasi:

  • Menjalankan evaluasi secara manual — Klik tombol Run Now di halaman Ops Backlog untuk segera memulai evaluasi. Ini berguna ketika penyelidikan baru-baru ini menjamin perputaran cepat pada perbaikan yang direkomendasikan.

  • Menghentikan evaluasi aktif — Klik tombol Stop Evaluation di halaman Ops Backlog untuk menghentikan evaluasi yang sedang berlangsung.

Mengelola rekomendasi

AWS DevOps Agen memberikan rekomendasi di halaman Ops Backlog tempat Anda dapat meninjau dan mengelolanya:

  • Melihat rincian rekomendasi — Klik pada rekomendasi untuk membuka halaman rincian rekomendasi, di mana Anda dapat melihat informasi lebih lanjut tentang perbaikan yang disarankan termasuk insiden yang menginformasikan rekomendasi, dampak yang diharapkan, dan langkah selanjutnya. Untuk rekomendasi dengan perubahan kode, Anda juga dapat melihat spesifikasi siap agen yang dapat diserahkan ke agen pengkodean untuk implementasi.

  • Keep — Klik 'Keep' untuk menyimpan rekomendasi di backlog Anda untuk melacak. Ini memungkinkan Anda untuk memantau perbaikan mana yang Anda rencanakan untuk diterapkan dan melacak kemajuannya.

  • Buang — Klik 'Buang' untuk menghapus rekomendasi dari backlog Anda. Ketika Anda membuang rekomendasi, Anda dapat memberikan penjelasan bahasa alami mengapa itu tidak memenuhi kebutuhan Anda. Agen belajar dari umpan balik ini dan menggunakannya untuk menginformasikan rekomendasi future, memastikan mereka menjadi lebih selaras dengan prioritas operasional dan persyaratan Anda dari waktu ke waktu.

  • Diimplementasikan — Klik 'Diimplementasikan' untuk menandai rekomendasi sebagai selesai. Ini membantu Anda melacak perbaikan mana yang telah diterapkan dan memungkinkan agen untuk mengukur efektivitas rekomendasinya dari waktu ke waktu.

  • Penghapusan otomatis — Rekomendasi yang belum ditandai sebagai Tetap atau Diimplementasikan dapat dihapus setelah sekitar 6 minggu jika tidak ada insiden baru yang dicegah dengan menerapkan rekomendasi. Ini memastikan halaman Ops Backlog berfokus pada peningkatan yang paling relevan untuk tantangan operasional Anda.

  • Pembaruan rekomendasi — Rekomendasi yang ada diperbarui ketika insiden baru ditemukan yang akan dicegah oleh rekomendasi. Pembaruan dapat mengubah prioritas rekomendasi atau menyempurnakan rekomendasi berdasarkan wawasan baru.

Spesifikasi siap agen

Untuk rekomendasi yang melibatkan perubahan kode atau konfigurasi, AWS DevOps Agen dapat menghasilkan spesifikasi siap agen. Spesifikasi ini menyediakan dokumen terstruktur yang dapat diserahkan langsung ke agen pengkodean untuk implementasi.

Spesifikasi meliputi:

  • Pernyataan masalah — Ringkasan masalah dan akar penyebabnya

  • Ringkasan solusi — Deskripsi tingkat tinggi dari pendekatan yang direkomendasikan

  • Repositori target - Repositori spesifik tempat perubahan perlu dilakukan

  • Perubahan kode — Deskripsi terperinci tentang apa yang perlu diubah dan mengapa, dengan jalur file tertentu dan pertimbangan implementasi

  • Persyaratan pengujian - Skenario apa yang perlu diuji

  • Rencana implementasi — Pendekatan bertahap untuk mengimplementasikan perubahan

Spesifikasi siap agen mempercepat implementasi dengan menyediakan agen pengkodean dengan konteks yang mereka butuhkan untuk membuat perubahan siap produksi tanpa memerlukan ekstensif dengan insinyur. back-and-forth

Menerapkan rekomendasi

Untuk memaksimalkan nilai rekomendasi pencegahan insiden proaktif, pertimbangkan praktik berikut untuk menindaklanjutinya:

  • Menggunakan spesifikasi siap agen — Untuk rekomendasi dengan perubahan kode, gunakan spesifikasi yang dihasilkan untuk mempercepat implementasi dengan menyerahkannya ke agen pengkodean atau menggunakannya sebagai panduan terperinci untuk implementasi manual.

  • Menambahkan rekomendasi ke backlog tiket Anda — Salin rekomendasi ke sistem tiket tim Anda atau alat manajemen proyek untuk memastikan mereka diprioritaskan bersama pekerjaan teknik lainnya.

  • Memprioritaskan rekomendasi berdasarkan dampak — Fokus pertama pada rekomendasi yang membahas jenis insiden yang paling sering atau parah, atau yang mempengaruhi sistem kritis.

  • Melacak kemajuan implementasi — Memantau rekomendasi mana yang telah diterapkan dan mengukur efektivitasnya dengan mengamati apakah insiden serupa menurun dari waktu ke waktu.

  • Berkoordinasi dengan tim pengembangan — Bagikan rekomendasi dengan tim yang sesuai yang memiliki sistem yang terpengaruh, memastikan mereka memiliki konteks dan sumber daya yang diperlukan untuk menerapkan perbaikan.