API del programador del rastreador
La API del programador de rastreadores describe los tipos de datos de rastreadores de AWS Glue, junto con la API para crear, eliminar, actualizar y ver listas de rastreadores.
Tipos de datos
Estructura de programación
Objeto de programación que usa una instrucción cron para programar un evento.
Campos
-
ScheduleExpression: cadena UTF-8.Expresión
cronutilizada para especificar el programa (consulte Programaciones basadas en tiempo para trabajos y rastreadores). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique:cron(15 12 * * ? *). -
State: cadena UTF-8 (valores válidos:SCHEDULED|NOT_SCHEDULED|TRANSITIONING).Estado del programa.
Operaciones
Acción UpdateCrawlerSchedule (Python: update_crawler_schedule)
Actualiza la programación de un rastreador mediante una expresión cron.
Solicitud
-
CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.El nombre del rastreador cuya programación se debe actualizar.
-
Schedule: cadena UTF-8.La expresión
cronactualizada que se utiliza para especificar el programa (consulte el tema sobre programaciones basadas en tiempo para trabajos y rastreadores). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique:cron(15 12 * * ? *).
Respuesta
Sin parámetros de respuesta.
Errores
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
Acción StartCrawlerSchedule (Python: start_crawler_schedule)
Cambia el estado de programación del rastreador especificado para SCHEDULED, salvo que el rastreador ya se esté ejecutando o el estado de programación ya esté en SCHEDULED.
Solicitud
-
CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.Nombre del rastreador que se va a programar.
Respuesta
Sin parámetros de respuesta.
Errores
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
Acción StopCrawlerSchedule (Python: stop_crawler_schedule)
Establece el estado del programador del rastreador especificado en NOT_SCHEDULED, pero no detiene el rastreador si ya se está ejecutando.
Solicitud
-
CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.Nombre del rastreador cuyo estado de programación se va a definir.
Respuesta
Sin parámetros de respuesta.
Errores
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException