在 Athena 中註冊 Redshift 資料目錄 - Amazon Athena

在 Athena 中註冊 Redshift 資料目錄

Athena 可以讀取和寫入存放在 Redshift 叢集或已在 AWS Glue Data Catalog 中註冊的無伺服器命名空間中的資料。這會與 AWS Lake Formation 串聯運用,而後者可提供集中式安全與控管,確保跨不同的查詢引擎持續管理資料存取,並維護共用 Redshift 資料的精細存取控制。

考量與限制

  • 具體化視觀表 – Amazon Redshift 具體化視觀表可從 Athena 查詢,但不支援使用 Athena 或 Spark 建立具體化視觀表。

  • 不支援 DDL 操作,包括在 Amazon Redshift 受管儲存資料表上設定 AWS Glue Data Catalog 組態和操作。

必要條件

在從 Athena 查詢 AWS Glue 資料目錄之前,請先完成下列任務:

  1. 建立 Amazon Redshift 叢集或無伺服器命名空間,並將其註冊至 AWS Glue Data Catalog。如需詳細資訊,請參閱《Amazon Redshift 管理指南》中的將叢集註冊至 AWS Glue Data Catalog將命名空間註冊至 AWS Glue Data Catalog

  2. 在 AWS Lake Formation 中,從註冊的命名空間建立資料目錄。如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的建立 Amazon Redshift 聯合目錄

  3. (選用) 使用 Lake Formation 在目錄上設定精細存取控制。如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的將您的資料匯入 AWS Glue Data Catalog

向 Athena 主控台註冊 Redshift 資料目錄

要向 Athena 主控台註冊 Redshift 資料目錄,請遵循下列步驟。

  1. 前往 https://console.aws.amazon.com/athena/ 開啟 Athena 主控台。

  2. 在導覽窗格中,選擇資料來源和目錄

  3. 資料來源和目錄頁面上,選擇建立資料來源

  4. 對於選擇資料來源,選擇 Amazon S3 - AWS Glue Data Catalog

  5. AWS Glue Data Catalog 區段中,對於資料來源帳戶,選擇此帳戶中的 AWS Glue Data Catalog

  6. 對於建立資料表或註冊目錄,選擇註冊新的 AWS Glue 目錄

  7. 資料來源詳細資訊區段中,對於資料來源名稱,輸入要用來在 SQL 查詢中指定資料來源的名稱,或使用產生的預設名稱。

  8. 對於目錄,選擇瀏覽,以搜尋相同帳戶中 AWS Glue 目錄的清單。如果沒有看到任何現有的目錄,請在 AWS Glue 主控台中建立一個。

  9. 瀏覽 AWS Glue 目錄對話方塊中,選取您要使用的目錄,然後選擇選擇

  10. (選用) 對於標籤,輸入您希望與資料來源關聯的鍵值對。

  11. 選擇下一步

  12. 檢閱和建立頁面上,驗證您輸入的資訊是否正確無誤,然後選擇建立資料來源