Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menskalakan rekayasa kekacauan di seluruh organisasi Anda
Ketika organisasi Anda mengadopsi rekayasa kekacauan, standardisasi dan menerapkannya akan menghadirkan tantangan. Pada tahap awal kematangan, tim yang berbeda cenderung menggunakan perkakas dan variasi yang berbeda dari proses rekayasa kekacauan yang dijelaskan di bagian sebelumnya. Pada saat yang sama, beberapa tim mungkin tidak memprioritaskan atau mengadopsi rekayasa kekacauan sama sekali, terlepas dari potensi manfaatnya. Bagian berikut memberikan panduan tentang cara mengatasi tantangan ini.
Secara keseluruhan, pendekatan Anda terhadap rekayasa kekacauan harus dirancang untuk mencapai keseimbangan antara kepemimpinan terpusat dan partisipasi terdesentralisasi. Keseimbangan ini membantu memastikan bahwa rekayasa kekacauan diintegrasikan ke dalam proses pengembangan dan pembelajaran dibagikan di seluruh organisasi Anda.
Membangun praktik rekayasa kekacauan
Standarisasi praktik rekayasa kekacauan dapat mempercepat adopsi. Berbagi pembelajaran dari eksperimen lintas tim dapat memperbesar laba atas investasi rekayasa kekacauan.
Bangun pusat keunggulan terpusat, atau kumpulkan sekelompok ahli materi pelajaran, sebagai bagian dari praktik rekayasa kekacauan Anda. Sebagai fungsi kecil dan terpusat, tim ini dapat berfungsi di seluruh pengembangan perangkat lunak, infrastruktur, keamanan, dan tim bisnis dan mempertahankan standar yang digunakan oleh tim tersebut. Untuk kesederhanaan, pusat keunggulan disebut tim praktik terpusat, dan kelompok yang menerapkan rekayasa kekacauan disebut tim praktik di sisa panduan ini.
Peran tim praktik terpusat
Tim praktik terpusat bertanggung jawab untuk mengembangkan dan menerapkan praktik rekayasa kekacauan di seluruh organisasi. Mereka bekerja sama dengan tim yang berlatih untuk membimbing mereka dalam merancang dan melakukan eksperimen, dan memastikan bahwa eksperimen tersebut berharga bagi bisnis. Tim praktik terpusat juga memberikan panduan dan dukungan kepada tim pengembangan, infrastruktur, dan keamanan untuk membantu mereka mengintegrasikan rekayasa kekacauan ke dalam proses pengembangan mereka.
Tanggung jawab utama dari tim praktik rekayasa kekacauan terpusat meliputi:
-
Pemberdayaan — Fungsi rekayasa kekacauan terpusat bertindak sebagai fasilitator untuk memperkenalkan praktik rekayasa kekacauan melalui hari-hari permainan dan lokakarya. Mereka memandu tim dalam proses rekayasa kekacauan, termasuk memilih skenario kegagalan, mendefinisikan hipotesis, dan menghasilkan laporan untuk dibagikan dengan organisasi yang lebih luas. Tim praktik terpusat harus memiliki materi pelatihan dan bekerja untuk meningkatkan keterampilan tim yang berlatih dalam penggunaan rekayasa kekacauan.
-
Penasihat — Tim praktik terpusat juga dapat bertindak dalam peran penasihat untuk mengawasi eksperimen yang dilakukan oleh tim yang berlatih. Pengalaman dan pengetahuan mereka dapat memastikan bahwa eksperimen memberikan nilai bagi bisnis dan dilakukan dengan cara yang aman. Demikian pula, tim dapat mengawasi eksekusi dan tanya jawab eksperimen untuk membimbing orang-orang yang baru mengenal rekayasa kekacauan.
-
Pemasaran dan pelacakan nilai — Mengkomunikasikan nilai bisnis dari rekayasa kekacauan adalah kunci keberhasilan program semacam itu. Setiap tim yang berpartisipasi dalam eksperimen rekayasa kekacauan harus mengumpulkan data dari eksperimen di seluruh bisnis dan menunjukkan nilai investasi organisasi ke dalam rekayasa kekacauan. Ini termasuk mengukur dan merayakan jumlah insiden yang dihindari selama setiap percobaan, waktu henti yang akan terjadi jika percobaan gagal, dan dampak keseluruhan terhadap bisnis jika skenario kegagalan terjadi dalam produksi. Dengan mengumpulkan dan memusatkan data tersebut dari seluruh tim, dan membuat data tersedia di seluruh organisasi, tim praktik terpusat dapat melacak dan memengaruhi nilai yang berasal dari adopsi rekayasa kekacauan di seluruh organisasi.
-
Standar — Tim praktik terpusat harus memiliki dan memelihara proses untuk melakukan eksperimen chaos, templat untuk perencanaan dan pelaporan eksperimen, dan perkakas yang digunakan untuk melakukan eksperimen.
Tim pusat harus memiliki dan mengelola templat perencanaan eksperimen, templat laporan eksperimen, dokumentasi proses, dan materi pemberdayaan. Dokumentasi praktik terbaik dan materi pemberdayaan memberikan panduan kepada tim yang berlatih tentang topik-topik seperti pagar pembatas yang dapat mereka gunakan untuk membatasi dampak eksperimen, kapan harus melakukan eksperimen dalam produksi, dan bagaimana mengembangkan penggunaan rekayasa kekacauan dari waktu ke waktu. Untuk contoh template dan output, lihat lampiran.
Tim praktik terpusat juga harus memiliki proses untuk melakukan eksperimen, termasuk komunikasi dan eskalasi, dan kapan dan bagaimana berkomunikasi dengan tim lain dalam organisasi sebelum atau selama percobaan. Prosesnya juga harus menguraikan kapan pagar pembatas diperlukan.
Tim praktik terpusat juga harus memilih dan memiliki alat inti untuk melakukan eksperimen kekacauan (misalnya, alat seperti AWS FIS). Pemilihan dan implementasi alat pelengkap, seperti alat pembangkit beban, harus diserahkan kepada tim yang berlatih untuk memutuskan. Tim yang berlatih harus dapat menyesuaikan keseluruhan proses dan perkakas agar sesuai dengan kebutuhan mereka.
Peran tim yang berlatih
Tim terpusat bertanggung jawab untuk mendorong strategi rekayasa kekacauan secara keseluruhan, sedangkan tim yang berlatih berpartisipasi dalam proses dan memiliki pengembangan dan pelaksanaan eksperimen. Ini membantu memastikan bahwa eksperimen relevan dengan setiap produk atau layanan tertentu, dan bahwa pembelajaran dapat ditindaklanjuti dan dapat diterapkan untuk meningkatkan keandalan dan ketahanan produk. Tim praktik terpusat bertindak sebagai mentor dan pemilik standar dan proses rekayasa kekacauan organisasi. Namun, untuk mencegah tim terpusat menjadi hambatan, tim latihan individu perlu belajar dari praktik pusat untuk melakukan eksperimen kekacauan untuk diri mereka sendiri.
Membangun komunitas praktik
Selain membuat tim terpusat, kami menyarankan Anda untuk membentuk komunitas praktisi informal yang tertarik pada rekayasa kekacauan. Komunitas ini menyediakan platform untuk berbagi pengetahuan, praktik terbaik, dan pengalaman di seluruh tim yang berlatih dan organisasi yang lebih luas.
Komunitas praktik dapat dioperasikan oleh tim praktik teknik chaos terpusat, tetapi siapa pun di dalam organisasi dapat menjadi anggota komunitas. Tim terpusat dapat memanfaatkan komunitas praktik untuk menyiarkan pembaruan dan pembelajaran sumber, dan untuk mengumpulkan umpan balik dari tim yang berlatih yang menggunakan standar dan proses yang dikelola oleh tim terpusat. Komunitas akan bertindak sebagai loop umpan balik untuk menginformasikan tim terpusat tentang efektivitas praktik rekayasa kekacauan di seluruh tim yang berlatih. Tim praktik terpusat kemudian dapat menyesuaikan dokumentasi mereka dan artefak pendukung untuk mendukung tim produk dengan sebaik-baiknya.
Memasukkan rekayasa kekacauan ke dalam ketahanan operasional Anda
Eksperimen kekacauan adalah investasi oleh bisnis Anda untuk mencegah insiden dalam produksi. Penting untuk menentukan di mana bisnis dapat mewujudkan pengembalian terbesar atas investasi ini. Organisasi dapat bekerja dengan tim praktik rekayasa kekacauan terpusat untuk memperbarui standarnya dan menentukan produk mana yang cukup penting untuk memerlukan eksperimen kekacauan.
Proses pengembangan sistem
Rekayasa kekacauan dan eksperimen chaos harus dilakukan berulang kali sebagai bagian dari siklus hidup aplikasi. Mirip dengan bagaimana tim secara teratur melakukan tes pemulihan bencana, mereka harus melakukan eksperimen kekacauan dan hari permainan secara terus menerus dan berkala sepanjang tahun. Pendekatan ini meningkatkan bagaimana organisasi mengantisipasi, mengamati, dan menanggapi insiden.