本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS Glue Studio 中使用資料準備配方
資料準備配方轉換可讓您使用互動式網格樣式撰寫介面,從頭開始撰寫資料準備配方。其還允許您匯入現有的 AWS Glue DataBrew 配方,然後在 AWS Glue Studio 中編輯其。
您可以從「資源」面板取得資料準備配方節點。您可以將資料準備配方節點連線至視覺化工作流程中的另一個節點,無論它是資料來源節點還是其他轉換節點。選擇 AWS Glue DataBrew 配方和版本之後,配方中套用的步驟就會顯示在節點屬性索引標籤中。
先決條件
-
如果匯入 AWS Glue DataBrew 配方,則您具有所需的 IAM 許可,如 在 中匯入 AWS Glue DataBrew 配方 AWS Glue Studio 中所述。
-
必須建立資料預覽工作階段。
限制
-
AWS Glue DataBrew 配方僅在商業 DataBrew 區域受支援。
-
並非所有 AWS Glue DataBrew 配方都受到 AWS Glue 支援。某些配方無法在 AWS Glue Studio 中執行。
-
不支援具有
UNION和JOIN轉換的配方,但是,AWS Glue Studio 已具有「聯結」和「聯集」轉換節點,可用於資料準備配方節點之前或之後。
-
-
從 AWS Glue 4.0 版開始的任務支援資料準備配方節點。將資料準備配方節點新增至任務後,系統會自動選取此版本。
-
資料準備配方節點需要使用 Python。當資料準備配方節點新增至任務時,會自動設定此選項。
-
將新的資料準備配方節點新增至視覺化圖表時,系統會自動使用正確的程式庫重新啟動您的資料預覽工作階段,以使用資料準備配方節點。
-
資料準備配方節點不支援匯入或編輯下列轉換:
GROUP_BY、PIVOT、UNPIVOT和TRANSPOSE。
額外功能
選取資料準備配方轉換後,您可以在選擇撰寫配方之後採取其他動作。
-
新增步驟 – 您可以視需要透過選擇「新增步驟」圖示為配方新增其他步驟,或透過選擇一個動作來使用「預覽」窗格中的工具列。
-
匯入配方 – 選擇更多,然後選擇匯入配方以用於您的 AWS Glue Studio 任務。
-
以 YAML 格式下載 – 選擇更多,然後選擇以 YAML 格式下載以下載您的配方,以在 AWS Glue Studio 外部儲存。
-
以 JSON 格式下載 – 選擇更多,然後選擇以 JSON 格式下載以下載您的配方,以在 AWS Glue Studio 外部儲存。
-
復原和重做配方步驟 – 使用網格中的資料時,您可以在「預覽」窗格中復原和重做配方步驟。