本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
互動範例
中的 Amazon Q 資料整合 AWS Glue 可讓您在 Amazon Q 面板中輸入您的問題。可以輸入有關 AWS Glue提供的資料整合功能的問題。將傳回詳細答案以及參考文件。
另一個使用案例是產生 AWS Glue ETL 任務指令碼。可以詢問有關如何執行資料擷取、轉換、載入任務的問題。將傳回產生的 PySpark 指令碼。
Amazon Q 聊天互動
在 AWS Glue 主控台上,開始撰寫新任務,並詢問 Amazon Q:「在資料庫 glue_db 中建立 Glue ETL 流程連線到兩個 Glue 目錄資料表場地和事件,在場地的 venueid 和事件的 e_venueid 上加入結果,然後篩選條件為 venuestate='DC' 的場地狀態,並以 CSV 格式寫入 s3://amzn-s3-demo-bucket/codegen/BDB-9999/output/""。
您會注意到程式碼已產生。透過此回應,您可以學習並了解如何為目的編寫 AWS Glue 程式碼。可以將產生的程式碼複製/貼上至指令碼編輯器並設定預留位置。在任務上設定 IAM 角色和 AWS Glue 連線後,請儲存並執行任務。當任務完成時,可以驗證摘要資料如預期保留至 Amazon S3,並可供下游工作負載使用。
AWS Glue Studio 筆記本互動
注意
AWS Glue Studio 筆記本中的 Amazon Q Data 整合體驗仍著重於以 DynamicFrame 為基礎的資料整合流程。
新增儲存格並輸入註解,以描述您想要達成的目標。按 Tab 和 Enter 後,會顯示建議的程式碼。
首要目的是擷取資料:"Give me code that reads a Glue Data Catalog table",後面跟著 "Give me code to apply a filter transform with star_rating>3" 和 "Give me code that writes the frame into S3 as Parquet"。
與 Amazon Q 聊天體驗類似,建議使用程式碼。如果按 Tab,則會選擇建議的程式碼。
在產生的程式碼中為您的來源填入適當的選項,以執行每個儲存格。在執行中的任何時間點,也可以使用 show() 方法來預覽資料集的範例。
透過程式設計方式或選擇執行,將筆記本作為任務來執行。
複雜的提示
可以產生具有單一複雜提示的完整指令碼。「我在 S3 中有 JSON 資料,在 Oracle 中有需要合併的資料。請提供 Glue 指令碼,其可從兩個來源讀取、進行聯結,然後將結果寫入到 Redshift。」
您可能會注意到,在筆記本上, 中的 Amazon Q 資料整合 AWS Glue 產生的程式碼片段與 Amazon Q 聊天中產生的程式碼片段相同。
透過選擇執行或以程式設計方式,將筆記本作為任務來執行。