在 Athena 中註冊 Redshift 資料目錄
Athena 可以讀取和寫入存放在 Redshift 叢集或已在 AWS Glue Data Catalog 中註冊的無伺服器命名空間中的資料。這會與 AWS Lake Formation 串聯運用,而後者可提供集中式安全與控管,確保跨不同的查詢引擎持續管理資料存取,並維護共用 Redshift 資料的精細存取控制。
考量與限制
-
具體化視觀表 – Amazon Redshift 具體化視觀表可從 Athena 查詢,但不支援使用 Athena 或 Spark 建立具體化視觀表。
-
不支援 DDL 操作,包括在 Amazon Redshift 受管儲存資料表上設定 AWS Glue Data Catalog 組態和操作。
必要條件
在從 Athena 查詢 AWS Glue 資料目錄之前,請先完成下列任務:
-
建立 Amazon Redshift 叢集或無伺服器命名空間,並將其註冊至 AWS Glue Data Catalog。如需詳細資訊,請參閱《Amazon Redshift 管理指南》中的將叢集註冊至 AWS Glue Data Catalog 或將命名空間註冊至 AWS Glue Data Catalog。
-
在 AWS Lake Formation 中,從註冊的命名空間建立資料目錄。如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的建立 Amazon Redshift 聯合目錄。
-
(選用) 使用 Lake Formation 在目錄上設定精細存取控制。如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的將您的資料匯入 AWS Glue Data Catalog。
向 Athena 主控台註冊 Redshift 資料目錄
要向 Athena 主控台註冊 Redshift 資料目錄,請遵循下列步驟。
-
前往 https://console.aws.amazon.com/athena/
開啟 Athena 主控台。 -
在導覽窗格中,選擇資料來源和目錄。
-
在資料來源和目錄頁面上,選擇建立資料來源。
-
對於選擇資料來源,選擇 Amazon S3 - AWS Glue Data Catalog。
-
在 AWS Glue Data Catalog 區段中,對於資料來源帳戶,選擇此帳戶中的 AWS Glue Data Catalog。
-
對於建立資料表或註冊目錄,選擇註冊新的 AWS Glue 目錄。
-
在資料來源詳細資訊區段中,對於資料來源名稱,輸入要用來在 SQL 查詢中指定資料來源的名稱,或使用產生的預設名稱。
-
對於目錄,選擇瀏覽,以搜尋相同帳戶中 AWS Glue 目錄的清單。如果沒有看到任何現有的目錄,請在 AWS Glue 主控台
中建立一個。 -
在瀏覽 AWS Glue 目錄對話方塊中,選取您要使用的目錄,然後選擇選擇。
-
(選用) 對於標籤,輸入您希望與資料來源關聯的鍵值對。
-
選擇下一步。
-
在檢閱和建立頁面上,驗證您輸入的資訊是否正確無誤,然後選擇建立資料來源。