View a markdown version of this page

OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya - AWS Well-Architected Framework

OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya

Pahami siapa yang bertanggung jawab untuk menjalankan aktivitas tertentu terhadap beban kerja yang ditentukan serta alasan adanya tanggung jawab tersebut. Memahami siapa yang bertanggung jawab untuk menjalankan aktivitas dapat memberikan informasi tentang siapa yang akan melakukan aktivitas tersebut, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas.

Hasil yang diinginkan:

Organisasi Anda secara jelas menetapkan tanggung jawab untuk menjalankan aktivitas tertentu pada beban kerja yang ditentukan dan merespons peristiwa yang dihasilkan oleh beban kerja tersebut. Organisasi mendokumentasikan kepemilikan proses dan pemenuhan dan membuat informasi ini dapat ditemukan. Anda meninjau dan memperbarui tanggung jawab ketika terjadi perubahan pada organisasi, dan tim melacak serta mengukur kinerja aktivitas identifikasi kekurangan dan inefisiensi. Anda mengimplementasikan mekanisme umpan balik untuk melacak kekurangan dan perbaikan serta mendukung perbaikan berulang.

Antipola umum:

  • Anda tidak mendokumentasikan tanggung jawab.

  • Terdapat skrip yang terfragmentasi di stasiun kerja operator yang terisolasi. Hanya beberapa orang yang tahu cara menggunakannya atau menjadikannya referensi secara informal sebagai pengetahuan tim.

  • Proses warisan sudah harus diperbarui, tetapi tidak ada yang tahu siapa yang memiliki proses tersebut, dan penulis aslinya sudah bukan bagian dari organisasi.

  • Proses dan skrip tidak dapat ditemukan, dan tidak tersedia saat diperlukan (misalnya, dalam merespons insiden).

Manfaat menjalankan praktik terbaik ini:

  • Anda memahami siapa yang bertanggung jawab untuk menjalankan sebuah aktivitas, siapa yang harus diberi tahu saat diperlukan tindakan, dan siapa yang melakukan tindakan, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas tersebut.

  • Proses dan prosedur meningkatkan upaya Anda untuk mengoperasikan beban kerja Anda.

  • Anggota tim baru menjadi lebih efektif dengan lebih cepat.

  • Anda mengurangi waktu yang dibutuhkan untuk memitigasi insiden.

  • Tim yang berbeda menggunakan proses dan prosedur yang sama untuk melakukan tugas secara konsisten.

  • Tim dapat menskalakan proses mereka dengan proses yang dapat diulang.

  • Proses dan prosedur standar membantu mengurangi dampak pengalihan tanggung jawab beban kerja antartim.

Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan: Tinggi

Panduan implementasi

Untuk mulai menentukan tanggung jawab, mulailah dengan dokumentasi yang sudah ada, seperti matriks tanggung jawab, proses dan prosedur, peran dan tanggung jawab, serta alat dan otomatisasi. Tinjau dan lakukan diskusi tentang tanggung jawab untuk proses yang terdokumentasi. Tinjau bersama tim untuk mengidentifikasi ketidakselarasan antara tanggung jawab dokumen dan proses. Diskusikan layanan yang ditawarkan dengan pelanggan internal tim tersebut untuk mengidentifikasi perbedaan ekspektasi di antara tim.

Analisis dan atasi perbedaan. Identifikasi peluang perbaikan, dan cari aktivitas padat sumber daya yang sering diminta, yang biasanya merupakan kandidat kuat untuk perbaikan. Jelajahi praktik terbaik, pola, dan panduan preskriptif untuk menyederhanakan dan menstandardisasi perbaikan. Dokumentasikan peluang perbaikan, dan lacak perbaikan hingga selesai.

Seiring waktu, prosedur ini harus dikembangkan agar dijalankan sebagai kode, sehingga mengurangi kebutuhan campur tangan manusia. Misalnya, prosedur dapat dimulai dalam bentuk fungsi AWS Lambda, templat CloudFormation, atau dokumen Otomatisasi AWS Systems Manager. Verifikasikan bahwa semua prosedur ini memiliki kontrol versi di repositori yang sesuai, dan sertakan tag sumber daya yang sesuai sehingga tim dapat mengidentifikasi pemilik dan dokumentasi dengan mudah. Dokumentasikan tanggung jawab untuk melaksanakan aktivitas, kemudian pantau otomatisasi untuk inisiasi dan operasi yang berhasil, serta kinerja hasil yang diinginkan.

Contoh pelanggan

AnyCompany Retail mendefinisikan kepemilikan sebagai tim atau individu yang memiliki proses untuk suatu aplikasi atau kelompok aplikasi yang memiliki teknologi dan praktik arsitektur yang sama. Awalnya, perusahaan ini mendokumentasikan proses dan prosedur dalam bentuk panduan langkah demi langkah di dalam sistem manajemen dokumen. Mereka membuat prosedur dapat ditemukan menggunakan tag pada Akun AWS yang meng-host aplikasi dan pada kelompok sumber daya tertentu di dalam akun, dengan menggunakan AWS Organizations untuk mengelola Akun AWS mereka. Seiring waktu, AnyCompany Retail mengonversi proses-proses tersebut menjadi kode dan mendefinisikan sumber daya menggunakan infrastruktur sebagai kode (melalui layanan seperti CloudFormation atau templat AWS Cloud Development Kit (AWS CDK)). Proses operasional menjadi dokumen otomatisasi di dalam fungsi AWS atau Systems Manager, yang dapat dimulai sebagai tugas terjadwal untuk merespons peristiwa seperti alarm AWS Lambda atau peristiwa Amazon CloudWatch, atau berdasarkan permintaan di dalam platform manajemen layanan IT (ITSM). Semua proses memiliki tag untuk mengidentifikasi pemiliknya. Tim mengelola dokumentasi untuk otomatisasi dan proses di dalam halaman wiki yang dihasilkan oleh repositori kode untuk proses tersebut.

Langkah implementasi

  1. Dokumentasikan proses dan prosedur yang ada.

    1. Tinjau dan pastikan dokumentasi tersebut mutakhir.

    2. Verifikasikan bahwa setiap proses atau prosedur mempunyai pemilik.

    3. Tempatkan prosedur di bawah kontrol versi.

    4. Jika memungkinkan, bagikan proses dan prosedur di seluruh beban kerja dan lingkungan yang berbagi desain arsitektur.

  2. Buat mekanisme untuk umpan balik dan perbaikan.

    1. Tentukan kebijakan untuk frekuensi peninjauan proses.

    2. Tentukan proses untuk peninjau dan pemberi persetujuan.

    3. Implementasikan permasalahan atau antrean tiket untuk memberikan dan melacak umpan balik.

    4. Jika memungkinkan, sediakan klasifikasi risiko dan persetujuan awal untuk proses dan prosedur dari dewan persetujuan perubahan (CAB).

  3. Buat proses dan prosedur dapat diakses dan ditemukan oleh pengguna yang perlu menjalankannya.

    1. Gunakan tag untuk menunjukkan di mana proses dan prosedur dapat diakses untuk beban kerja.

    2. Gunakan pesan kesalahan dan peristiwa yang dapat dipahami untuk menunjukkan proses atau prosedur yang sesuai untuk mengatasi masalah.

    3. Gunakan wiki atau manajemen dokumen agar proses dan prosedur dapat dicari secara konsisten di seluruh organisasi.

  4. Lakukan otomatisasi jika perlu.

    1. Kembangkan otomatisasi ketika layanan dan teknologi menyediakan API.

    2. Verifikasikan bahwa proses dapat dipahami dengan baik, dan kembangkan kisah serta persyaratan pengguna untuk mengotomatiskan proses tersebut.

    3. Ukur penggunaan proses dan prosedur yang sukses, dengan pelacakan masalah untuk mendukung perbaikan berulang.

Tingkat upaya untuk rencana implementasi: Sedang

Sumber daya

Praktik terbaik terkait:

Dokumen terkait:

Video terkait:

Contoh terkait: