使用 SQL 延伸模組瀏覽資料 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 SQL 延伸模組瀏覽資料

若要開啟 SQL 延伸模組使用者介面 (UI),請在 Studio 中 JupyterLab 應用程式的導覽窗格中選擇 SQL 延伸模組圖示 ( Purple circular icon with a clock symbol representing time or scheduling. )。左側面板資料探索檢視會展開,並顯示所有預先設定的資料存放區與 Amazon Athena、Amazon Redshift 和 Snowflake 的連線。

從那裡,您可以:

  • 展開特定連線以探索其資料庫、結構描述、資料表或檢視,以及資料欄。

  • 使用 SQL 延伸模組 UI 中的搜尋方塊搜尋特定連線。搜尋會傳回任何其部分符合您所輸入字串的資料庫、結構描述、資料表或檢視。

注意

如果AWS您的帳戶中已設定 Athena,您可以在 JupyterLab default-athena-connection 應用程式中啟用 。這可讓您執行 Athena 查詢,而不需要手動建立連線。若要啟用預設 Athena 連線:

  1. 請洽詢您的管理員,您的執行角色是否具有存取 Athena 和 AWS Glue目錄所需的許可。如需所需許可的詳細資訊,請參閱設定 Athena 的 AWS Glue 連線

  2. 在您的 JupyterLab 應用程式中,導覽至頂端導覽列中的設定功能表,並開啟設定編輯器功能表。

  3. 選擇資料探索

  4. 勾選啟用預設 Athena 連線的方塊。

  5. 如有需要,您可以更新預設 primary WorkGroup。

若要從 SQL 延伸模組窗格中的指定連線查詢 JupyterLab 筆記本中的資料庫、結構描述或資料表:

  • 選擇任何資料庫、結構描述或資料表右側的三點圖示 ( SQL extension three dots icon. )。

  • 從功能表中選取在筆記本中查詢

    這會自動使用相關的 %%sm_sql 魔術命令,在 JupyterLab 中填入筆記本儲存格,以連線至資料來源。它也會新增範例 SQL 陳述式,協助您立即開始查詢。您可以使用延伸模組的自動完成和醒目提示功能,進一步精簡 SQL 查詢。如需使用 SQL 延伸模組 SQL 編輯器的詳細資訊,請參閱 JupyterLab SQL 延伸模組的 SQL 編輯器功能

在資料表層級,三點圖示提供額外選項,讓您選擇預覽資料表的中繼資料。

下方的 JupyterLab 筆記本儲存格內容顯示一個範例,指出在 SQL 延伸模組窗格的 redshift-connection 資料來源上選取在筆記本中查詢功能表時自動產生的內容。

%%sm_sql --metastore-id redshift-connection --metastore-type GLUE_CONNECTION -- Query to list tables from schema 'dev.public' SHOW TABLES FROM SCHEMA "dev"."public"

使用 SQL 延伸模組窗格頂端的小於符號 ( Icon to clear the SQL extension search box. ),清除搜尋方塊或返回連線清單。

注意

延伸模組會快取您的探索結果,以進行快速存取。如果快取的結果已過期或連線從您的清單中遺失,您可以選擇 SQL 延伸模組面板底部的重新整理按鈕來手動重新整理快取。如需連線快取的詳細資訊,請參閱SQL 延伸模組連線快取