

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立自動處理新資料的排程
<a name="canvas-data-export-schedule-job"></a>

**注意**  
下節僅適用於 SageMaker 處理任務。如果您使用預設的 Canvas 設定或 EMR Serverless 來建立遠端任務，以將轉換套用至完整資料集，則本節不適用。

如果您要定期處理資料，則可以建立排程以自動執行處理任務。例如您可以建立排程，在獲得新資料時自動執行處理任務。如需處理任務的詳細資訊，請參閱[匯出至 Amazon S3](canvas-export-data.md#canvas-export-data-s3)。

建立任務時，必須指定一個 IAM 角色，具備建立該任務的許可。您可以使用 [AmazonSageMakerCanvasDataPrepFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasDataPrepFullAccess.html) 政策來新增許可。

將下列信任政策新增至角色，以便 EventBridge 加以採用。

```
{
    "Effect": "Allow",
    "Principal": {
        "Service": "events.amazonaws.com"
    },
    "Action": "sts:AssumeRole"
}
```

**重要**  
當您建立排程時，Data Wrangler 會在 EventBridge 中建立一個 `eventRule`。您建立的事件規則和用於執行處理任務的執行個體都會產生費用。  
如需 EventBridge 定價的詳細資訊，請參閱 [Amazon EventBridge 定價](https://aws.amazon.com/eventbridge/pricing/)。有關處理任務定價的資訊，請參閱 [Amazon SageMaker 定價](https://aws.amazon.com/sagemaker/pricing/)。

您可以使用以下其中一個方法建立排程：
+ [Cron 表達式](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-create-rule-schedule.html)
**注意**  
Data Wrangler 不支援以下表達式：  
LW \#
天的縮寫
月的縮寫
+ [Rate 表達式](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-create-rule-schedule.html#eb-rate-expressions)
+ 週期性 — 設定每小時或每日執行任務的間隔。
+ 指定時間 — 設定執行任務的特定日期和時間。

下列各節提供在[將資料匯出至 Amazon S3](canvas-export-data.md#canvas-export-data-s3) 時，於填寫 SageMaker AI 處理任務設定時排程任務的程序。下列所有指示都從 SageMaker 處理任務設定的**關聯排程**區段開始。

------
#### [ CRON ]

使用下列程序建立包含 CRON 表達式的排程。

1. 在**匯出至 Amazon S3** 側邊面板中，確定您已關閉**自動任務組態**切換，並已選取 **SageMaker 處理**選項。

1. 在 **SageMaker 處理**任務設定中，開啟**關聯排程**區段，然後選擇**建立新排程**。

1. **建立新排程**對話方塊隨即開啟。針對**排程名稱**，請指定排程的名稱。

1. 針對**執行頻率**，請選擇 **CRON**。

1. 針對每個**分鐘**、**小時**、**當月日期**、**月**和**星期幾**欄位，輸入有效的 CRON 表達式值。

1. 選擇**建立**。

1. (選用) 選擇**新增另一個排程**，在另一個排程執行任務。
**注意**  
您最多可以關聯兩個排程。這些排程是獨立的，除非時間重疊，否則不會相互影響。

1. 選擇下列其中一項：
   + **立即排程並執行** - 任務會立即執行，之後按排程執行。
   + **僅限排程** - 任務只會按您指定的排程執行。

1. 在完成其餘匯出任務設定之後，請選擇**匯出**。

------
#### [ RATE ]

使用下列程序建立包含 RATE 表達式的排程。

1. 在**匯出至 Amazon S3** 側邊面板中，確定您已關閉**自動任務組態**切換，並已選取 **SageMaker 處理**選項。

1. 在 **SageMaker 處理**任務設定中，開啟**關聯排程**區段，然後選擇**建立新排程**。

1. **建立新排程**對話方塊隨即開啟。針對**排程名稱**，請指定排程的名稱。

1. 針對**執行頻率**，請選擇 **Rate**。

1. 針對**值**，請指定整數。

1. 針對**單位**，請選擇下列項目之一：
   + **分鐘**
   + **小時**
   + **天**

1. 選擇**建立**。

1. (選用) 選擇**新增另一個排程**，在另一個排程執行任務。
**注意**  
您最多可以關聯兩個排程。這些排程是獨立的，除非時間重疊，否則不會相互影響。

1. 選擇下列其中一項：
   + **立即排程並執行** - 任務會立即執行，之後按排程執行。
   + **僅限排程** - 任務只會按您指定的排程執行。

1. 在完成其餘匯出任務設定之後，請選擇**匯出**。

------
#### [ Recurring ]

請使用下列程序來建立週期性基礎的任務執行排程。

1. 在**匯出至 Amazon S3** 側邊面板中，確定您已關閉**自動任務組態**切換，並已選取 **SageMaker 處理**選項。

1. 在 **SageMaker 處理**任務設定中，開啟**關聯排程**區段，然後選擇**建立新排程**。

1. **建立新排程**對話方塊隨即開啟。針對**排程名稱**，請指定排程的名稱。

1. 針對**執行頻率**，選擇**週期性**。

1. 針對**每 x 小時**，請指定任務在一天中執行的小時頻率。有效值是 **1** 與 **23** 之包含範圍內的整數。

1. 針對**在這些日子**，選擇以下其中一個選項：
   + **每天**
   + **週末**
   + **平日**
   + **選擇天數**

   1. (選用) 如果您已選取**選取天數**，請選擇一週中的哪幾天要執行任務。
**注意**  
排程會每天重設一次。如果您將任務排定為每五個小時執行一次，則它會在一天的下列時間執行：  
00：00
05：00
10：00
15：00
20：00

1. 選擇**建立**。

1. (選用) 選擇**新增另一個排程**，在另一個排程執行任務。
**注意**  
您最多可以關聯兩個排程。這些排程是獨立的，除非時間重疊，否則不會相互影響。

1. 選擇下列其中一項：
   + **立即排程並執行** - 任務會立即執行，之後按排程執行。
   + **僅限排程** - 任務只會按您指定的排程執行。

1. 在完成其餘匯出任務設定之後，請選擇**匯出**。

------
#### [ Specific time ]

請使用下列程序來建立在指定時間執行任務的排程。

1. 在**匯出至 Amazon S3** 側邊面板中，確定您已關閉**自動任務組態**切換，並已選取 **SageMaker 處理**選項。

1. 在 **SageMaker 處理**任務設定中，開啟**關聯排程**區段，然後選擇**建立新排程**。

1. **建立新排程**對話方塊隨即開啟。針對**排程名稱**，請指定排程的名稱。

1. 針對**執行頻率**，選擇**開始時間**。

1. 針對**開始時間**，以 UTC 格式輸入時間 (例如，**09:00**)。開始時間預設為您所在的時區。

1. 針對**在這些日子**，選擇以下其中一個選項：
   + **每天**
   + **週末**
   + **平日**
   + **選擇天數**

   1. (選用) 如果您已選取**選取天數**，請選擇一週中的哪幾天要執行任務。

1. 選擇**建立**。

1. (選用) 選擇**新增另一個排程**，在另一個排程執行任務。
**注意**  
您最多可以關聯兩個排程。這些排程是獨立的，除非時間重疊，否則不會相互影響。

1. 選擇下列其中一項：
   + **立即排程並執行** - 任務會立即執行，之後按排程執行。
   + **僅限排程** - 任務只會按您指定的排程執行。

1. 在完成其餘匯出任務設定之後，請選擇**匯出**。

------

您可以使用 SageMaker AI AWS 管理主控台 來檢視排程執行的任務。您的處理任務會在 Pipelines 內執行。每個處理任務都有自己的管道。它的運作方式為管道內的處理步驟。您可以檢視您在管道中建立的排程。如需在檢視管道更多資訊，請參閱[檢視管道的詳細資訊](pipelines-studio-list.md)。

使用下列程序來檢視您已排定的任務。

若要檢視您已排定的任務，請執行下列操作。

1. 開啟 Amazon SageMaker Studio Classic。

1. 開啟管道

1. 檢視您已建立之任務管道。

   執行任務的管道字首會使用任務名稱。例如，如果您已建立名為 `housing-data-feature-enginnering` 的任務，則管道的名稱為 `canvas-data-prep-housing-data-feature-engineering`。

1. 選擇包含任務的管道。

1. 檢視管道的狀態。**狀態**為**成功**的管道表示已成功執行處理任務。

若要停止執行處理任務，請執行下列動作：

若要停止執行處理任務，請刪除指定排程的事件規則。刪除事件規則會停止執行與該排程相關聯的所有任務。如需刪除規則的相關資訊，請參閱[停用或刪除 Amazon EventBridge 規則](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-delete-rule.html)。

您也可以停止和刪除與排程相關聯的管道。如需停止管道的相關資訊，請參閱 [StopPipelineExecution](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_StopPipelineExecution.html)。如需刪除管道的相關資訊，請參閱 [DeletePipeline](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DeletePipeline.html#API_DeletePipeline_RequestSyntax)。