本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS Glue Studio 中使用資料準備配方
資料準備配方轉換可讓您使用互動式網格樣式編寫界面,從頭開始編寫資料準備配方。它還允許您匯入現有的 AWS Glue DataBrew 配方,然後在其中編輯它 AWS Glue Studio。
您可以從「資源」面板取得資料準備配方節點。您可以將資料準備配方節點連線至視覺化工作流程中的另一個節點,無論它是資料來源節點還是其他轉換節點。選擇 AWS Glue DataBrew 配方和版本後,配方中套用的步驟會顯示在節點屬性索引標籤中。
先決條件
-
如果匯入 AWS Glue DataBrew 配方,您可以擁有必要的 IAM 許可,如 在 中匯入 AWS Glue DataBrew 配方 AWS Glue Studio 中所述。
-
必須建立資料預覽工作階段。
限制
-
AWS Glue DataBrew 配方僅在商業 DataBrew 區域支援。
-
並非所有 AWS Glue DataBrew 配方都受 支援AWS Glue。某些配方無法在 AWS Glue Studio 中執行。
-
不支援具有
UNION
和JOIN
轉換的配方,但AWS Glue Studio已有「加入」和「聯合」轉換節點,可在資料準備配方節點之前或之後使用。
-
-
從 AWS Glue 4.0 版開始的任務支援資料準備配方節點。將資料準備配方節點新增至任務後,系統會自動選取此版本。
-
資料準備配方節點需要使用 Python。當資料準備配方節點新增至任務時,會自動設定此選項。
-
將新的 Data Preparation Recipe 節點新增至視覺化圖形,您的 Data Preview 工作階段會自動重新啟動,並使用正確的程式庫來使用 Data Preparation Recipe 節點。
-
下列轉換不支援在資料準備配方節點中匯入或編輯:
GROUP_BY
、UNPIVOT
、PIVOT
和TRANSPOSE
。
額外功能
選取資料準備配方轉換後,您可以在選擇作者配方之後採取其他動作。
-
新增步驟 – 您可以視需要選擇新增步驟圖示,將其他步驟新增至配方,或選擇動作,在預覽窗格中使用工具列。
-
匯入配方 – 選擇更多,然後選擇匯入配方以用於您的 AWS Glue Studio 任務。
-
下載為 YAML – 選擇 更多,然後選擇 下載為 YAML 以下載您的配方,以在外部儲存 AWS Glue Studio。
-
下載為 JSON – 選擇 更多,然後選擇 下載為 JSON 以下載您的配方,以在 外部儲存 AWS Glue Studio。
-
復原和重做配方步驟 – 使用網格中的資料時,您可以在預覽窗格中復原和重做配方步驟。