

AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. [Pelajari selengkapnya](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Kegagalan dan tayangan ulang yang berulang
<a name="dp-manage-cascade-failandrerun"></a>

AWS Data Pipeline memungkinkan Anda mengonfigurasi cara objek pipeline berperilaku ketika ketergantungan gagal atau dibatalkan oleh pengguna. Anda dapat memastikan bahwa kegagalan kaskade ke objek alur lain (konsumen), untuk mencegah menunggu tanpa batas. Semua aktivitas, simpul data, dan prasyarat memiliki bidang bernama `failureAndRerunMode` dengan nilai default `none`. Untuk mengaktifkan cascading kegagalan, atur bidang `failureAndRerunMode` ke `cascade`. 

Saat bidang ini diaktifkan, kegagalan kaskade terjadi jika objek alur diblokir dalam status `WAITING_ON_DEPENDENCIES` dan dependensi apa pun telah gagal tanpa perintah tertunda. Selama kegagalan kaskade, peristiwa berikut terjadi:
+ Ketika sebuah objek gagal, konsumennya diatur ke `CASCADE_FAILED` dan objek asli serta prasyarat konsumennya diatur ke `CANCELED`.
+ Setiap objek yang sudah `FINISHED`, `FAILED`, atau `CANCELED` diabaikan.

Kegagalan kaskade tidak beroperasi pada dependensi objek gagal (hulu), kecuali untuk prasyarat yang terkait dengan objek gagal asli. Objek alur yang terpengaruh oleh kegagalan kaskade dapat memicu percobaan ulang atau tindakan pasca apa pun, seperti `onFail`.

Efek detail dari cascading kegagalan bergantung pada jenis objek.

## Aktivitas
<a name="dp-manage-cascade-activity"></a>

Aktivitas berubah menjadi `CASCADE_FAILED` jika salah satu dependensinya gagal, dan selanjutnya memicu kegagalan kaskade di konsumen aktivitas. Jika sumber daya gagal yang mana aktivitas tergantung padanya, aktivitas tersebut `CANCELED` dan semua konsumennya berubah menjadi `CASCADE_FAILED`.

## Node dan prasyarat data
<a name="dp-manage-cascade-datanode"></a>

Jika simpul data dikonfigurasi sebagai output dari aktivitas yang gagal, simpul data berubah ke status `CASCADE_FAILED`. Kegagalan simpul data menyebar ke setiap prasyarat terkait, yang berubah ke status `CANCELED`.

## Sumber daya
<a name="dp-manage-cascade-resources"></a>

Jika objek yang bergantung pada sumber daya berada dalam status `FAILED` dan sumber daya itu sendiri dalam status `WAITING_ON_DEPENDENCIES`, maka sumber daya berubah ke status `FINISHED`.

## Menjalankan kembali objek yang gagal bertingkat
<a name="dp-manage-cascade-rerun"></a>

Secara default, menjalankan ulang aktivitas atau simpul data apa pun hanya akan menjalankan ulang sumber daya terkait. Namun, mengatur bidang `failureAndRerunMode` ke `cascade` pada objek alur memungkinkan perintah jalankan ulang pada objek target untuk disebarkan ke semua konsumen, dalam kondisi berikut: 
+ Konsumen objek target berada dalam status `CASCADE_FAILED`.
+ Dependensi objek target tidak memiliki perintah jalankan ulang yang tertunda.
+ Dependensi objek target tidak dalam status `FAILED`, `CASCADE_FAILED`, atau `CANCELED`.

Jika Anda mencoba menjalankan ulang objek `CASCADE_FAILED` dan salah satu dependensinya adalah `FAILED`, `CASCADE_FAILED`, atau `CANCELED`, penjalanan ulang akan gagal dan mengembalikan objek ke status `CASCADE_FAILED`. Agar berhasil menjalankan ulang objek yang gagal, Anda harus melacak kegagalan ke rantai dependensi untuk menemukan sumber asli kegagalan dan menjalankan ulang objek tersebut. Ketika Anda mengeluarkan perintah jalankan ulang pada sumber daya, Anda juga mencoba menjalankan ulang objek apa pun yang bergantung padanya. 

## Kegagalan bertingkat dan penimbunan ulang
<a name="dp-manage-cascade-backfills"></a>

Jika Anda mengaktifkan kegagalan kaskade dan memiliki pipeline yang membuat banyak pengisian ulang, kesalahan runtime pipeline dapat menyebabkan sumber daya dibuat dan dihapus secara berurutan tanpa melakukan pekerjaan yang berguna. AWS Data Pipeline mencoba mengingatkan Anda tentang situasi ini dengan pesan peringatan berikut saat Anda menyimpan pipeline: ` {{Pipeline_object_name}} has 'failureAndRerunMode' field set to 'cascade' and you are about to create a backfill with scheduleStartTime {{start_time}}. This can result in rapid creation of pipeline objects in case of failures. ` Ini terjadi karena kegagalan kaskade dapat dengan cepat mengatur aktivitas hilir dan mematikan kluster EMR `CASCADE_FAILED` dan sumber daya EC2 yang tidak lagi diperlukan. Kami merekomendasikan agar Anda menguji alur dengan rentang waktu yang singkat untuk membatasi efek dari situasi ini. 