Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Ketahanan dalam Layanan Terkelola Amazon untuk Apache Flink
<a name="disaster-recovery-resiliency"></a>

Infrastruktur AWS global dibangun di sekitar AWS Wilayah dan Zona Ketersediaan. AWS Wilayah menyediakan beberapa Availability Zone yang terpisah secara fisik dan terisolasi, yang terhubung dengan latensi rendah, throughput tinggi, dan jaringan yang sangat redundan. Dengan Zona Ketersediaan, Anda dapat merancang dan mengoperasikan aplikasi dan basis data yang secara otomatis melakukan failover di antara Zona Ketersediaan tanpa gangguan. Zona Ketersediaan memiliki ketersediaan dan toleransi kesalahan yang lebih baik, dan dapat diskalakan dibandingkan infrastruktur biasa yang terdiri dari satu atau beberapa pusat data. 

Untuk informasi selengkapnya tentang AWS Wilayah dan Availability Zone, lihat [Infrastruktur AWS Global](https://aws.amazon.com/about-aws/global-infrastructure/).

Selain infrastruktur AWS global, Layanan Terkelola untuk Apache Flink menawarkan beberapa fitur untuk membantu mendukung ketahanan data dan kebutuhan cadangan Anda.

## Pemulihan bencana
<a name="disaster-recovery"></a>

Layanan Terkelola untuk Apache Flink berjalan dalam mode tanpa server, dan menangani degradasi host, ketersediaan Zona Ketersediaan, dan masalah terkait infrastruktur lainnya dengan melakukan migrasi otomatis. Layanan Terkelola untuk Apache Flink mencapai ini melalui beberapa mekanisme yang berlebihan. Setiap Layanan Terkelola untuk aplikasi Apache Flink berjalan dalam cluster Apache Flink penyewa tunggal. Cluster Apache Flink dijalankan dengan mode ketersediaan tinggi menggunakan Zookeeper JobMananger di beberapa zona ketersediaan. Layanan Terkelola untuk Apache Flink menyebarkan Apache Flink menggunakan Amazon EKS. Beberapa pod Kubernetes digunakan di Amazon EKS untuk setiap AWS wilayah di seluruh zona ketersediaan. Jika terjadi kegagalan, Managed Service for Apache Flink pertama-tama mencoba memulihkan aplikasi dalam cluster Apache Flink yang sedang berjalan menggunakan pos pemeriksaan aplikasi Anda, jika tersedia.

*Layanan Terkelola untuk Apache Flink mencadangkan status aplikasi menggunakan *Checkpoints* dan Snapshots:*
+ *Checkpoint* adalah backup dari status aplikasi yang Managed Service untuk Apache Flink secara otomatis membuat secara berkala dan menggunakan untuk memulihkan dari kesalahan.
+ *Snapshot* adalah cadangan dari status aplikasi yang Anda buat dan pulihkan secara manual.

Untuk informasi selengkapnya tentang titik pemeriksaan dan snapshot, lihat [Menerapkan toleransi kesalahan](how-fault.md).

## Penentuan versi
<a name="versioning"></a>

Versi status aplikasi yang disimpan dibuat versi sebagai berikut:
+ Versi *titik pemeriksaan* dibuat secara otomatis oleh layanan. Jika layanan menggunakan titik pemeriksaan untuk memulai ulang aplikasi, titik pemeriksaan terbaru akan digunakan. 
+ *Savepoints* diversi menggunakan **SnapshotName**parameter tindakan. [CreateApplicationSnapshot](https://docs.aws.amazon.com/managed-flink/latest/apiv2/API_CreateApplicationSnapshot.html)

Layanan Terkelola untuk Apache Flink mengenkripsi data yang disimpan di pos pemeriksaan dan savepoint.