在 Quick Sight 中使用 Databricks - Amazon Quick Suite

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Quick Sight 中使用 Databricks

使用本節了解如何從 Quick Sight 連線至 Databricks。

若要連線至 Databricks
  1. 首先建立新的資料集。從左側的導覽窗格中選擇資料

  2. 選擇建立,然後選擇新資料集

  3. 選擇 Databricks 資料來源卡片。

  4. 對於資料來源名稱,為 Databricks 資料來源連線輸入一個描述性名稱,例如 Databricks CS。因為您可以透過與 Databricks 的連線建立許多資料集,因此最好保持名稱簡單。

  5. 對於連線類型,選取您正在使用的網路類型。

    • 公共網路 – 如果您的資料是公開共用的。

    • VPC – 如果您的資料位於 VPC 內。

    注意

    如果您正在使用 VPC,但沒有看到它列出,請洽詢管理員。

  6. 對於資料庫伺服器,輸入 Databricks 連線詳細資訊中指定的工作區主機名稱

  7. 對於 HTTP 路徑,輸入 Databricks 連線詳細資訊中指定的 spark 執行個體的部分 URL

  8. 連接埠中,輸入 Databricks 連線詳細資訊中指定的連接埠

  9. 使用者名稱密碼中,輸入您的連線憑證。

  10. 若要驗證連線是否正常運作,請按一下驗證連線

  11. 若要完成並建立資料來源,請按一下建立資料來源

為 Databricks 新增 Quick Sight 資料集

當您有 Databricks 資料的現有資料來源連線之後,可以建立 Databricks 資料集以用於分析。

若要使用 Databricks 建立資料集
  1. 選擇左側的資料,然後向下捲動以尋找 Databricks 連線的資料來源卡。如果您有許多資料來源,可以使用頁面頂端的搜尋列來尋找名稱部分相符的資料來源。

  2. 選擇 Databricks 資料來源卡片,然後選擇建立資料集

  3. 若要指定要連線到的資料表,請先選取要使用的型錄和結構描述。接下來,在資料表中選取您要使用的資料表。如果您想使用自己的 SQL 陳述式,請選取使用自訂 SQL

  4. 選擇編輯/預覽

  5. (選用) 若要新增更多資料,請執行下列步驟:

    1. 選擇右上角的新增資料

    2. 若要連線到不同的資料,請選擇切換資料來源,然後選擇不同的資料集。

    3. 依照 UI 提示完成新增資料。

    4. 將新資料新增至相同的資料集後,選擇設定此聯結 (兩個紅點)。為每個額外的資料表設定一個聯結。

    5. 若要新增計算欄位,選擇新增計算欄位

    6. 若要從 SageMaker AI 新增模型,選擇使用 SageMaker 擴增。此選項僅適用於 Quick Suite Enterprise Edition。

    7. 清除要省略之任何欄位的核取方塊。

    8. 更新要變更的任何資料類型。

  6. 完成後,選擇儲存以儲存並關閉資料集。

連接 Databricks 的 Quick Sight 管理員指南

您可以使用 Amazon Quick Sight 連線到 Databricks AWS。無論您透過 AWS Marketplace 還是 Databricks 網站 AWS 註冊 ,都可以連線到 Databricks。

在您可以連線到 Databricks 之前,請先建立或識別連線所需的現有資源。使用本節協助您收集從 Quick Sight 連線到 Databricks 所需的資源。

  • 若要了解如何獲取 Databricks 連線詳細資訊,請參閱 Databricks ODBC 和 JDBC 連線

  • 若要了解如何取得 Databricks 憑證 (個人存取權杖或使用者名稱和密碼) 以進行驗證,請參閱 Databricks 文件中的身分驗證要求

    若要連線至 Databricks 叢集,您需要 Can Attach ToCan Restart 許可。這些許可在資料庫中管理。如需詳細資訊,請參閱 Databricks 文件中的許可要求

  • 如果您要為 Databricks 設定私有連線,您可以進一步了解如何設定 VPC 以搭配 Quick Sight 使用,請參閱 Quick Sight 文件中的使用 Amazon Quick Sight 連線至 VPC。如果連線不可見,請與系統管理員確認網路是否已開啟 Amazon Route 53 的傳入端點。如果 Databricks 工作區的主機名稱使用公用 IP,則對於 Route 53 安全群組,需要有 DNS TCP 和 DNS UDP 傳入及傳出規則,才能允許流量通過 DNS 連接埠 53。系統管理員需要建立具有 2 個傳入規則的安全群組:一個用於連接埠 53 到 VPC CIDR 的 DNS(TCP),另一個用於連接埠 53 到 VPC CIDR 的 DNS(UDP)。

    如果您使用 PrivateLink 而非公有連線,請參閱 Databricks 文件中的 Enable AWS PrivateLink,以取得 Databricks 相關詳細資訊。 https://docs.databricks.com/index.html