View a markdown version of this page

Prinsip desain - AWS Well-Architected Framework

Prinsip desain

Berikut prinsip desain untuk keunggulan operasional di cloud:

  • Jalankan operasi sebagai kode: Di cloud, Anda dapat menerapkan teknik rekayasa yang sama yang Anda gunakan untuk kode aplikasi ke lingkungan Anda secara keseluruhan. Anda dapat menentukan seluruh beban kerja Anda (aplikasi, infrastruktur, dst.) sebagai kode dan memperbaruinya dengan kode. Anda dapat merencanakan prosedur operasi Anda dan mengotomatiskan prosesnya dengan meluncurkannya saat peristiwa terjadi. Dengan melakukan operasi sebagai kode, Anda membatasi kesalahan manusia dan membuat respons yang sesuai terhadap peristiwa.

  • Buat perubahan yang sering, kecil, dan dapat dibalik: Rancang beban kerja yang dapat diskalakan dan digabungkan secara longgar untuk memungkinkan komponen diperbarui secara teratur. Teknik deployment otomatis bersama dengan perubahan yang lebih kecil dan bertahap mengurangi radius ledakan dan memungkinkan pembalikan lebih cepat ketika terjadi kegagalan. Hal ini meningkatkan kepercayaan diri untuk memberikan perubahan yang menguntungkan pada beban kerja Anda sekaligus mempertahankan kualitas dan beradaptasi dengan cepat terhadap perubahan kondisi pasar.

  • Sering-seringlah menyempurnakan prosedur operasi: Seiring dengan perkembangan beban kerja Anda, kembangkan operasi Anda dengan semestinya. Saat Anda menggunakan prosedur operasi, carilah peluang untuk meningkatkannya. Lakukan peninjauan rutin dan validasikan bahwa semua prosedur sudah efektif dan dipahami dengan baik oleh tim. Jika kesenjangan diidentifikasi, perbarui prosedur yang sesuai. Komunikasikan pembaruan prosedural kepada semua pemangku kepentingan dan tim. Ciptakan mekanisme yang menyenangkan dalam operasi Anda untuk berbagi praktik terbaik dan mengedukasi tim.

  • Antisipasi kegagalan: Lakukan uji pre-mortem untuk mengidentifikasi kemungkinan sumber kegagalan agar sumber tersebut dapat dihapus atau dimitigasi. Uji skenario kegagalan Anda dan validasi pemahaman Anda tentang dampaknya. Uji prosedur respons Anda untuk memastikan prosedur sudah efektif dan tim sudah memahami prosesnya. Atur game day secara rutin untuk menguji beban kerja dan respons tim terhadap simulasi peristiwa.

  • Belajar dari semua kegagalan operasional: Dorong peningkatan dengan belajar dari semua peristiwa dan kegagalan operasional yang telah terjadi. Bagikan materi yang telah dipelajari kepada seluruh tim dan organisasi.

  • Gunakan layanan terkelola: Kurangi beban operasional menggunakan layanan terkelola AWS jika memungkinkan. Bangun prosedur operasional seputar interaksi dengan layanan tersebut.

  • Terapkan observabilitas untuk wawasan yang dapat ditindaklanjuti: Dapatkan pemahaman komprehensif tentang perilaku beban kerja, performa, keandalan, biaya, dan kesehatan. Tetapkan indikator kinerja utama (KPI) dan manfaatkan telemetri observabilitas untuk membuat keputusan yang lebih tepat dan mengambil tindakan cepat ketika hasil bisnis berisiko. Tingkatkan performa, keandalan, dan biaya secara proaktif berdasarkan data observabilitas yang dapat ditindaklanjuti.