クローラースケジューラ API
クローラースケジューラ API では、AWS Glue クローラーのデータ型と、クローラーを作成、削除、更新、および一覧表示するための API について説明します。
データ型
Schedule 構造
cron ステートメントを使用してイベントをスケジュールするスケジューリングオブジェクト。
フィールド
-
ScheduleExpression– UTF-8 文字列。スケジュールを指定するために使用される
cron式 (ジョブとクローラーの時間ベースのスケジュールを参照してください。) たとえば、毎日 12:15 UTC に何かを実行するには、cron(15 12 * * ? *)を指定します。 -
State– UTF-8 文字列 (有効な値:SCHEDULED|NOT_SCHEDULED|TRANSITIONING)。スケジュールの状態。
操作
UpdateCrawlerSchedule アクション (Python: update_crawler_schedule)
cron 式を使用してクローラーのスケジュールを更新します。
リクエスト
-
CrawlerName– 必須: UTF-8 文字列。1~255 バイト長。Single-line string pattern に一致。スケジュールを更新するクローラーの名前。
-
Schedule– UTF–8 文字列。スケジュールを指定するために使用される更新された
cron式 (ジョブとクローラーの時間ベースのスケジュールを参照)。たとえば、毎日 12:15 UTC に何かを実行するには、cron(15 12 * * ? *)を指定します。
レスポンス
応答パラメータはありません。
エラー
EntityNotFoundExceptionInvalidInputExceptionVersionMismatchExceptionSchedulerTransitioningExceptionOperationTimeoutException
StartCrawlerSchedule アクション (Python: start_crawler_schedule)
クローラーがすでに実行中、またはスケジュールの状態がすでに SCHEDULED でなければ、指定されたクローラーのスケジュールの状態を SCHEDULED に変更します。
リクエスト
-
CrawlerName– 必須: UTF-8 文字列。1~255 バイト長。Single-line string pattern に一致。スケジュールするクローラーの名前。
レスポンス
応答パラメータはありません。
エラー
EntityNotFoundExceptionSchedulerRunningExceptionSchedulerTransitioningExceptionNoScheduleExceptionOperationTimeoutException
StopCrawlerSchedule アクション (Python: stop_crawler_schedule)
指定されたクローラーのスケジュールの状態を NOT_SCHEDULED に設定しますが、クローラーがすでに実行中の場合は停止されません。
リクエスト
-
CrawlerName– 必須: UTF-8 文字列。1~255 バイト長。Single-line string pattern に一致。スケジュールの状態を設定するクローラーの名前。
レスポンス
応答パラメータはありません。
エラー
EntityNotFoundExceptionSchedulerNotRunningExceptionSchedulerTransitioningExceptionOperationTimeoutException