Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Multi-Region fundamental 1: Memahami persyaratan
Seperti disebutkan sebelumnya, ketersediaan dan kontinuitas operasi yang tinggi adalah alasan umum untuk mengejar arsitektur Multi-wilayah. Metrik ketersediaan mengukur persentase waktu beban kerja tersedia untuk digunakan selama periode tertentu, sedangkan metrik kontinuitas operasi mengukur waktu pemulihan untuk peristiwa durasi skala besar, dan biasanya lebih lama.
Mengukur ketersediaan adalah proses yang hampir berkelanjutan. Pengukuran spesifik dapat bervariasi tetapi biasanya menyatu di sekitar metrik ketersediaan target, paling sering disebut sebagai sembilan (seperti ketersediaan 99,99 persen). Dengan tujuan ketersediaan, satu ukuran tidak cocok untuk semua. Anda harus menetapkan sasaran ketersediaan pada tingkat beban kerja dan memisahkan komponen non-kritis dari komponen penting, alih-alih menerapkan satu tujuan di semua beban kerja.
Untuk kelangsungan operasi, point-in-time pengukuran berikut biasanya digunakan:
-
Tujuan waktu pemulihan (RTO) - RTO adalah penundaan maksimum yang dapat diterima antara gangguan layanan dan pemulihan layanan. Nilai ini menentukan durasi yang dapat diterima di mana layanan terganggu.
-
Tujuan titik pemulihan (RPO) — RPO adalah jumlah waktu maksimum yang dapat diterima sejak titik pemulihan data terakhir. Ini menentukan apa yang dianggap sebagai kehilangan data yang dapat diterima antara titik pemulihan terbaru dan gangguan layanan.
Mirip dengan menetapkan tujuan ketersediaan, RTO dan RPO juga harus didefinisikan pada tingkat beban kerja. Kontinuitas operasi yang lebih agresif atau ketersediaan yang tinggi membutuhkan peningkatan investasi. Meskipun demikian, tidak setiap aplikasi dapat menuntut atau membutuhkan tingkat ketahanan yang sama. Menyelaraskan pemilik bisnis dan TI untuk menilai kekritisan aplikasi berdasarkan dampak bisnis dan kemudian meningkatkannya dapat membantu memberikan titik awal. Tabel berikut memberikan contoh tiering.
Tabel ini menunjukkan contoh tiering ketahanan untuk perjanjian tingkat layanan (). SLAs
Tingkat ketahanan | Ketersediaan SLA | Waktu henti/tahun yang dapat diterima |
---|---|---|
Platinum |
99,99% |
52.60 menit |
Emas |
99,90% |
8.77 jam |
Perak |
99,5% |
1.83 hari |
Tabel berikut menunjukkan contoh tiering ketahanan untuk RTO dan RPO.
Tingkat ketahanan | RTO Maksimum | RPO Maksimum | Kriteria | Biaya |
---|---|---|---|---|
Platinum |
15 menit |
5 menit |
Beban kerja kritis misi |
$$$ |
Emas |
15 menit — 6 jam |
2 jam |
Beban kerja penting tetapi tidak penting untuk misi |
$$ |
Perak |
6 jam — beberapa hari |
24 jam |
Beban kerja yang tidak kritis |
$ |
Saat Anda merancang beban kerja untuk ketahanan, pertimbangkan hubungan antara ketersediaan tinggi dan kontinuitas operasi. Misalnya, jika beban kerja membutuhkan ketersediaan 99,99 persen, tidak lebih dari 53 menit downtime per tahun dapat ditoleransi. Diperlukan setidaknya 5 menit untuk mendeteksi kegagalan dan 10 menit lagi bagi operator untuk terlibat, membuat keputusan tentang langkah-langkah pemulihan, dan melakukan langkah-langkah ini. Bukan hal yang aneh untuk mengambil 30 hingga 45 menit untuk pulih dari satu masalah. Dalam hal ini, akan bermanfaat untuk memiliki strategi Multi-wilayah untuk memberikan contoh terisolasi yang menghilangkan dampak yang berkorelasi. Hal ini memungkinkan operasi lanjutan dengan gagal dalam waktu terbatas saat Anda melakukan triase penurunan nilai awal secara independen. Di sinilah menentukan waktu pemulihan terbatas yang sesuai dan memastikan ada keselarasan diperlukan.
Pendekatan multi-wilayah mungkin sesuai untuk beban kerja mission-critical yang memiliki kebutuhan ketersediaan ekstrim (misalnya, 99,99 persen atau ketersediaan lebih tinggi) atau kontinuitas ketat persyaratan operasi yang hanya dapat dipenuhi dengan gagal masuk ke Wilayah lain. Namun, persyaratan ini biasanya hanya berlaku untuk sebagian kecil dari portofolio beban kerja perusahaan yang memiliki waktu pemulihan terbatas yang diukur dalam menit atau jam. Kecuali aplikasi memerlukan waktu pemulihan beberapa menit atau beberapa jam, mungkin pendekatan yang lebih baik untuk menunggu gangguan Regional terhadap aplikasi untuk diperbaiki di Wilayah yang terkena dampak. Pendekatan ini biasanya selaras dengan beban kerja tingkat yang lebih rendah.
Sebelum menerapkan arsitektur Multi-region, pengambil keputusan bisnis dan tim teknis harus selaras dengan implikasi biaya, termasuk penggerak biaya operasional dan infrastruktur. Arsitektur Multi-wilayah yang khas dapat dikenakan biaya yang dua kali lebih besar dari pendekatan Single-region. Meskipun ada beberapa pola Multi-wilayah untuk kelangsungan bisnis, seperti berjalan dengan siaga panas, siaga hangat, atau lampu pilot, pola dengan risiko terendah untuk memenuhi tujuan pemulihan akan melibatkan menjalankan siaga panas, dan akan menggandakan biaya untuk beban kerja Anda.
Panduan utama
-
Ketersediaan dan kelangsungan tujuan operasi seperti RTO dan RPO harus ditetapkan per beban kerja dan selaras dengan pemangku kepentingan bisnis dan TI.
-
Sebagian besar ketersediaan dan kelangsungan tujuan operasi dapat dipenuhi dalam satu Wilayah. Untuk tujuan yang tidak dapat dipenuhi dalam satu Wilayah, pertimbangkan Multi-wilayah dengan pandangan yang jelas tentang trade-off antara biaya, kompleksitas, dan manfaat.