在 AWS Glue Studio 中使用資料準備配方 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS Glue Studio 中使用資料準備配方

資料準備配方轉換可讓您使用互動式網格樣式編寫界面,從頭開始編寫資料準備配方。它還允許您匯入現有的 AWS Glue DataBrew 配方,然後在其中編輯它 AWS Glue Studio。

您可以從「資源」面板取得資料準備配方節點。您可以將資料準備配方節點連線至視覺化工作流程中的另一個節點,無論它是資料來源節點還是其他轉換節點。選擇 AWS Glue DataBrew 配方和版本後,配方中套用的步驟會顯示在節點屬性索引標籤中。

先決條件

限制

  • AWS Glue DataBrew 配方僅在商業 DataBrew 區域支援。

  • 並非所有 AWS Glue DataBrew 配方都受 支援AWS Glue。某些配方無法在 AWS Glue Studio 中執行。

    • 不支援具有 UNIONJOIN轉換的配方,但AWS Glue Studio已有「加入」和「聯合」轉換節點,可在資料準備配方節點之前或之後使用。

  • 從 AWS Glue 4.0 版開始的任務支援資料準備配方節點。將資料準備配方節點新增至任務後,系統會自動選取此版本。

  • 資料準備配方節點需要使用 Python。當資料準備配方節點新增至任務時,會自動設定此選項。

  • 將新的 Data Preparation Recipe 節點新增至視覺化圖形,您的 Data Preview 工作階段會自動重新啟動,並使用正確的程式庫來使用 Data Preparation Recipe 節點。

  • 下列轉換不支援在資料準備配方節點中匯入或編輯:GROUP_BYUNPIVOTPIVOTTRANSPOSE

額外功能

選取資料準備配方轉換後,您可以在選擇作者配方之後採取其他動作。

  • 新增步驟 – 您可以視需要選擇新增步驟圖示,將其他步驟新增至配方,或選擇動作,在預覽窗格中使用工具列。

    螢幕擷取畫面會顯示新增配方圖示。
    螢幕擷取畫面會顯示新增配方圖示。
  • 匯入配方 – 選擇更多,然後選擇匯入配方以用於您的 AWS Glue Studio 任務。

    螢幕擷取畫面會顯示更多圖示。
    螢幕擷取畫面會顯示更多圖示。
  • 下載為 YAML – 選擇 更多,然後選擇 下載為 YAML 以下載您的配方,以在外部儲存 AWS Glue Studio。

  • 下載為 JSON – 選擇 更多,然後選擇 下載為 JSON 以下載您的配方,以在 外部儲存 AWS Glue Studio。

  • 復原和重做配方步驟 – 使用網格中的資料時,您可以在預覽窗格中復原和重做配方步驟。

    螢幕擷取畫面會顯示更多圖示。