在 AWS Glue Studio 中使用資料準備配方 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS Glue Studio 中使用資料準備配方

資料準備配方轉換可讓您使用互動式網格樣式撰寫介面,從頭開始撰寫資料準備配方。其還允許您匯入現有的 AWS Glue DataBrew 配方,然後在 AWS Glue Studio 中編輯其。

您可以從「資源」面板取得資料準備配方節點。您可以將資料準備配方節點連線至視覺化工作流程中的另一個節點,無論它是資料來源節點還是其他轉換節點。選擇 AWS Glue DataBrew 配方和版本之後,配方中套用的步驟就會顯示在節點屬性索引標籤中。

先決條件

限制

  • AWS Glue DataBrew 配方僅在商業 DataBrew 區域受支援。

  • 並非所有 AWS Glue DataBrew 配方都受到 AWS Glue 支援。某些配方無法在 AWS Glue Studio 中執行。

    • 不支援具有 UNIONJOIN 轉換的配方,但是,AWS Glue Studio 已具有「聯結」和「聯集」轉換節點,可用於資料準備配方節點之前或之後。

  • 從 AWS Glue 4.0 版開始的任務支援資料準備配方節點。將資料準備配方節點新增至任務後,系統會自動選取此版本。

  • 資料準備配方節點需要使用 Python。當資料準備配方節點新增至任務時,會自動設定此選項。

  • 將新的資料準備配方節點新增至視覺化圖表時,系統會自動使用正確的程式庫重新啟動您的資料預覽工作階段,以使用資料準備配方節點。

  • 資料準備配方節點不支援匯入或編輯下列轉換:GROUP_BYPIVOTUNPIVOTTRANSPOSE

額外功能

選取資料準備配方轉換後,您可以在選擇撰寫配方之後採取其他動作。

  • 新增步驟 – 您可以視需要透過選擇「新增步驟」圖示為配方新增其他步驟,或透過選擇一個動作來使用「預覽」窗格中的工具列。

    螢幕擷取畫面顯示了「新增配方」圖示。
    螢幕擷取畫面顯示了「新增配方」圖示。
  • 匯入配方 – 選擇更多,然後選擇匯入配方以用於您的 AWS Glue Studio 任務。

    螢幕擷取畫面顯示了更多圖示。
    螢幕擷取畫面顯示了更多圖示。
  • 以 YAML 格式下載 – 選擇更多,然後選擇以 YAML 格式下載以下載您的配方,以在 AWS Glue Studio 外部儲存。

  • 以 JSON 格式下載 – 選擇更多,然後選擇以 JSON 格式下載以下載您的配方,以在 AWS Glue Studio 外部儲存。

  • 復原和重做配方步驟 – 使用網格中的資料時,您可以在「預覽」窗格中復原和重做配方步驟。

    螢幕擷取畫面顯示了更多圖示。