크롤러 스케줄러 API
크롤러 스케줄러 API는 크롤러를 생성, 삭제, 업데이트 및 나열하기 위한 API와 함께 AWS Glue 크롤러 데이터 유형에 대해 설명합니다.
데이터 타입
일정 구조
cron을 사용하여 객체의 일정을 정하여 이벤트의 일정을 정합니다.
필드
-
ScheduleExpression– UTF-8 문자열입니다.일정을 지정하는 데 사용되는
cron표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면cron(15 12 * * ? *)을 지정합니다. -
State– UTF-8 문자열입니다(유효 값:SCHEDULED|NOT_SCHEDULED|TRANSITIONING).일정 상태
운영
UpdateCrawlerSchedule 작업(Python: start_crawler_schedule)
cron 표현식을 사용하여 크롤러의 일정을 업데이트합니다.
요청
-
CrawlerName– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.업데이트할 일정이 있는 크롤러 이름입니다.
-
Schedule– UTF-8 문자열입니다.일정을 지정하는 데 사용되는 업데이트된
cron표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면cron(15 12 * * ? *)을 지정합니다.
응답
무응답 파라미터.
오류
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
StartCrawlerSchedule 작업(Python: start_crawler_schedule)
크롤러가 실행 중이거나 일정 상태가 이미 SCHEDULED로 되어있지 않는 한 지정된 크롤러의 일정 상태를 SCHEDULED로 변경합니다.
요청
-
CrawlerName– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.일정을 잡을 크롤러의 이름.
응답
무응답 파라미터.
오류
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
StopCrawlerSchedule 작업(Python: stop_crawler_schedule)
지정된 크롤러의 일정 상태를 NOT_SCHEDULED로 설정하지만 크롤러가 실행되고 있으면 크롤러를 중지하지 않습니다.
요청
-
CrawlerName– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.설정할 일정이 있는 크롤러 이름.
응답
무응답 파라미터.
오류
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException