Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
API du planificateur du crawler
L'API du planificateur de robots décrit les types de données des robots d' AWS Glue exploration, ainsi que l'API permettant de créer, de supprimer, de mettre à jour et de répertorier les robots d'exploration.
Types de données
Structure du planificateur
Objet de planification utilisant une instruction cron pour planifier un événement.
Champs
-
ScheduleExpression– Chaîne UTF-8.Une expression
cronutilisée pour spécifier la planification (consultez Time-Based Schedules for Jobs and Crawlers (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier :cron(15 12 * * ? *). -
State– Chaîne UTF-8 (valeurs valides :SCHEDULED|NOT_SCHEDULED|TRANSITIONING).État de la planification.
Opérations
UpdateCrawlerSchedule action (Python : update_crawler_schedule)
Met à jour la planification d'un crawler à l'aide d'une expression cron.
Demande
-
CrawlerName– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler dont la planification doit être mise à jour.
-
Schedule– Chaîne UTF-8.L'expression
cronmise à jour utilisée pour spécifier la planification (voir Planifications temporelles pour les tâches et les crawlers). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier :cron(15 12 * * ? *).
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
StartCrawlerSchedule action (Python : start_crawler_schedule)
Modifie l'état de la planification pour l'crawler spécifié par SCHEDULED, sauf si l'crawler est déjà en cours d'exécution ou si l'état de la planification est déjà SCHEDULED.
Demande
-
CrawlerName– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler à planifier.
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
StopCrawlerSchedule action (Python : stop_crawler_schedule)
Définit l'état de la planification de l'crawler spécifié sur NOT_SCHEDULED, mais n'arrête pas l'crawler s'il est déjà en cours d'exécution.
Demande
-
CrawlerName– Obligatoire : Chaîne UTF-8, d'une longueur comprise entre 1 et 255 octets, correspondant au Single-line string pattern.Nom de l'crawler dont l'état de la planification doit être défini.
Réponse
Paramètres d'absence de réponse.
Erreurs
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException