本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Quick Sight 中使用 Databricks
使用本節了解如何從 Quick Sight 連線至 Databricks。
若要連線至 Databricks
-
首先建立新的資料集。從左側的導覽窗格中選擇資料。
-
選擇建立,然後選擇新資料集。
-
選擇 Databricks 資料來源卡片。
-
對於資料來源名稱,為 Databricks 資料來源連線輸入一個描述性名稱,例如
Databricks CS。因為您可以透過與 Databricks 的連線建立許多資料集,因此最好保持名稱簡單。 -
對於連線類型,選取您正在使用的網路類型。
-
公共網路 – 如果您的資料是公開共用的。
-
VPC – 如果您的資料位於 VPC 內。
注意
如果您正在使用 VPC,但沒有看到它列出,請洽詢管理員。
-
-
對於資料庫伺服器,輸入 Databricks 連線詳細資訊中指定的工作區主機名稱。
-
對於 HTTP 路徑,輸入 Databricks 連線詳細資訊中指定的 spark 執行個體的部分 URL。
-
在連接埠中,輸入 Databricks 連線詳細資訊中指定的連接埠。
-
在使用者名稱和密碼中,輸入您的連線憑證。
-
若要驗證連線是否正常運作,請按一下驗證連線。
-
若要完成並建立資料來源,請按一下建立資料來源。
為 Databricks 新增 Quick Sight 資料集
當您有 Databricks 資料的現有資料來源連線之後,可以建立 Databricks 資料集以用於分析。
若要使用 Databricks 建立資料集
-
選擇左側的資料,然後向下捲動以尋找 Databricks 連線的資料來源卡。如果您有許多資料來源,可以使用頁面頂端的搜尋列來尋找名稱部分相符的資料來源。
-
選擇 Databricks 資料來源卡片,然後選擇建立資料集。
-
若要指定要連線到的資料表,請先選取要使用的型錄和結構描述。接下來,在資料表中選取您要使用的資料表。如果您想使用自己的 SQL 陳述式,請選取使用自訂 SQL。
-
選擇編輯/預覽。
-
(選用) 若要新增更多資料,請執行下列步驟:
-
選擇右上角的新增資料。
-
若要連線到不同的資料,請選擇切換資料來源,然後選擇不同的資料集。
-
依照 UI 提示完成新增資料。
-
將新資料新增至相同的資料集後,選擇設定此聯結 (兩個紅點)。為每個額外的資料表設定一個聯結。
-
若要新增計算欄位,選擇新增計算欄位。
-
若要從 SageMaker AI 新增模型,選擇使用 SageMaker 擴增。此選項僅適用於 Quick Suite Enterprise Edition。
-
清除要省略之任何欄位的核取方塊。
-
更新要變更的任何資料類型。
-
-
完成後,選擇儲存以儲存並關閉資料集。
連接 Databricks 的 Quick Sight 管理員指南
您可以使用 Amazon Quick Sight 連線到 Databricks AWS。無論您透過 AWS Marketplace 還是 Databricks 網站 AWS 註冊 ,都可以連線到 Databricks。
在您可以連線到 Databricks 之前,請先建立或識別連線所需的現有資源。使用本節協助您收集從 Quick Sight 連線到 Databricks 所需的資源。
-
若要了解如何獲取 Databricks 連線詳細資訊,請參閱 Databricks ODBC 和 JDBC 連線
。 -
若要了解如何取得 Databricks 憑證 (個人存取權杖或使用者名稱和密碼) 以進行驗證,請參閱 Databricks 文件
中的身分驗證要求 。 若要連線至 Databricks 叢集,您需要
Can Attach To和Can Restart許可。這些許可在資料庫中管理。如需詳細資訊,請參閱 Databricks 文件中的許可要求 。 -
如果您要為 Databricks 設定私有連線,您可以進一步了解如何設定 VPC 以搭配 Quick Sight 使用,請參閱 Quick Sight 文件中的使用 Amazon Quick Sight 連線至 VPC。如果連線不可見,請與系統管理員確認網路是否已開啟 Amazon Route 53 的傳入端點。如果 Databricks 工作區的主機名稱使用公用 IP,則對於 Route 53 安全群組,需要有 DNS TCP 和 DNS UDP 傳入及傳出規則,才能允許流量通過 DNS 連接埠 53。系統管理員需要建立具有 2 個傳入規則的安全群組:一個用於連接埠 53 到 VPC CIDR 的 DNS(TCP),另一個用於連接埠 53 到 VPC CIDR 的 DNS(UDP)。
如果您使用 PrivateLink 而非公有連線,請參閱 Databricks 文件中的 Enable AWS PrivateLink
,以取得 Databricks 相關詳細資訊。 https://docs.databricks.com/index.html