Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
API del pianificatore del crawler
L'API del pianificatore del crawler descrive i tipi di dati delle ricerche per indicizzazione AWS Glue e l'API per la loro creazione, eliminazione, aggiornamento ed elenco.
Tipi di dati
Struttura della pianificazione
Oggetto di pianificazione che utilizza una dichiarazione cron per pianificare un evento.
Campi
-
ScheduleExpression: stringa UTF-8.Espressione
cronusata per specificare la pianificazione (consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare:cron(15 12 * * ? *). -
State: stringa UTF-8 (valori validi:SCHEDULED|NOT_SCHEDULED|TRANSITIONING).Lo stato della pianificazione.
Operazioni
Operazione UpdateCrawlerSchedule (Python: update_crawler_schedule)
Aggiorna la pianificazione di un crawler utilizzando un'espressione cron.
Richiesta
-
CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler la cui programmazione è da aggiornare.
-
Schedule: stringa UTF-8.Espressione
cronaggiornata usata per specificare la pianificazione, consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare:cron(15 12 * * ? *).
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
Operazione StartCrawlerSchedule (Python: start_crawler_schedule)
Cambia lo stato della pianificazione del crawler specificato su SCHEDULED, a meno che il crawler non sia già in esecuzione o lo stato della pianificazione sia già impostata su SCHEDULED.
Richiesta
-
CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler da pianificare.
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
Operazione StopCrawlerSchedule (Python: stop_crawler_schedule)
Imposta lo stato della pianificazione del crawler specificato su NOT_SCHEDULED, ma non arresta il crawler se è già in esecuzione.
Richiesta
-
CrawlerName: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler il cui stato della programmazione è da impostare.
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException