API do programador do crawler
A API Crawler scheduler descreve os tipos de dados de crawler do AWS Glue, juntamente com a API para criar, excluir, atualizar e listar crawlers.
Tipos de dados
Estrutura Schedule
Um objeto de programação que usa uma instrução cron para programar um evento.
Campos
-
ScheduleExpression– String UTF-8.Uma expressão
cronusada para especificar a programação (consulte Programações baseadas em hora para tarefas e crawlers. Por exemplo, para executar algo todos os dias às 12h15 UTC, especifique:cron(15 12 * * ? *). -
State– String UTF-8 (valores válidos:SCHEDULED|NOT_SCHEDULED|TRANSITIONING).O estado da programação.
Operações
Ação UpdateCrawlerSchedule (Python: update_crawler_schedule)
Atualiza a programação de um crawler usando uma expressão cron.
Solicitação
-
CrawlerName: obrigatório: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.O nome do crawler cuja programação será atualizada.
-
Schedule– String UTF-8.A expressão
cronatualizada usada para especificar a programação (consulte Programações baseadas em hora para tarefas e crawlers). Por exemplo, para executar algo todos os dias às 12h15 UTC, especifique:cron(15 12 * * ? *).
Resposta
Nenhum parâmetro de resposta.
Erros
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
Ação StartCrawlerSchedule (Python: start_crawler_schedule)
Altera o estado da programação do crawler especificado para SCHEDULED, a menos que ele já esteja em execução ou o estado da programação já seja SCHEDULED.
Solicitação
-
CrawlerName: obrigatório: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.Nome do crawler a ser programado.
Resposta
Nenhum parâmetro de resposta.
Erros
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
Ação StopCrawlerSchedule (Python: stop_crawler_schedule)
Define o estado da programação do crawler especificado para NOT_SCHEDULED, mas não o interrompe se já estiver em execução.
Solicitação
-
CrawlerName: obrigatório: string UTF-8 com no mínimo 1 e no máximo 255 bytes de comprimento e correspondente a Single-line string pattern.Nome do crawler cujo estado da programação será definido.
Resposta
Nenhum parâmetro de resposta.
Erros
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException