Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
API penjadwal perayap
Crawler scheduler API menjelaskan tipe data AWS Glue crawler, bersama dengan API untuk membuat, menghapus, memperbarui, dan mencantumkan crawler.
Jenis Data
Struktur jadwal
Sebuah objek penjadwalan menggunakan pernyataan cron untuk menjadwalkan sebuah peristiwa.
Bidang
-
ScheduleExpression– String UTF-8.Sebuah ekspresi
cronyang digunakan untuk menentukan jadwal (lihat Jadwal Berbasis Waktu untuk Tugas dan Crawler. Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukancron(15 12 * * ? *). -
State– String UTF-8 (nilai yang valid:SCHEDULED|NOT_SCHEDULED|TRANSITIONING).Status jadwal.
Operasi
UpdateCrawlerSchedule tindakan (Python: update_crawler_schedule)
Memperbarui jadwal sebuah crawler dengan menggunakan ekspresi cron.
Permintaan
-
CrawlerName— Wajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.Nama crawler yang jadwalnya akan diperbarui.
-
Schedule– String UTF-8.Ekspresi
cronyang diperbarui yang digunakan untuk menentukan jadwal (lihat Jadwal Berbasis Waktu untuk Tugas dan Crawler. Sebagai contoh, untuk menjalankan sesuatu setiap hari pada 12:15 UTC, Anda harus menentukancron(15 12 * * ? *).
Respons
Tidak ada parameter Respons.
Kesalahan
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
StartCrawlerSchedule tindakan (Python: start_crawler_schedule)
Mengubah status jadwal crawler yang ditentukan untuk SCHEDULED, kecuali crawler sudah berjalan atau status jadwal sudah SCHEDULED.
Permintaan
-
CrawlerName— Wajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.Nama crawler yang akan dijadwal.
Respons
Tidak ada parameter Respons.
Kesalahan
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
StopCrawlerSchedule tindakan (Python: stop_crawler_schedule)
Menetapkan status jadwal dari crawler yang ditentukan untuk NOT_SCHEDULED, tapi tidak menghentikan crawler jika sudah berjalan.
Permintaan
-
CrawlerName— Wajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.Nama crawler yang status jadwalnya akan ditetapkan.
Respons
Tidak ada parameter Respons.
Kesalahan
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException