將您的連線註冊為 Glue Data Catalog - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將您的連線註冊為 Glue Data Catalog

建立資料來源之後,您可以使用 Athena 主控台,將您的連線註冊為 Glue Data Catalog。註冊後,您可以使用 Lake Formation 來管理聯合資料目錄並啟用精細存取控制。如需詳細資訊,請參閱建立聯合目錄

您可以註冊下列連接器,以與 整合AWS Glue以進行精細存取控制。

  • Redshift

  • BigQuery

  • DynamoDB (預覽版)

  • Snowflake (預覽版)

  • MySQL

  • PostgreSQL

  • AWSCMDB

  • Timestream

  • Azure Data Lake Storage

  • Azure Synapse

  • IBM Db2

  • IBM Db2 AS/400 (Db2 iSeries)

  • DocumentDB

  • Google Cloud Storage

  • HBase

  • OpenSearch

  • Oracle

  • SAP HANA

  • SQL Server

  • TPC-DS

  • Cloudera Hive

  • Cloudwatch

  • Cloudwatch 指標

  • Teradata

  • Vertica

先決條件

在開始之前,您必須完成以下先決條件。

  • 請確保您具有註冊位置所需的角色和許可。如需詳細資訊,請參閱《 AWS Lake Formation開發人員指南》中的角色需求

  • 請確保您具有必要的 Lake Formation 角色。如需詳細資訊,請參閱《 AWS Lake Formation開發人員指南》中的將 Data Catalog 連接到外部資料來源的先決條件

  • 您在 Glue 中註冊的角色必須具有下列範例中列出的許可。

    JSON
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix/*", "arn:aws:s3:::amzn-s3-demo-bucket/spill-prefix" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "arn:aws:lambda:us-east-1:111122223333:function:lambda_function_name" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:us-east-1:111122223333:connection/<connection_name>", "arn:aws:glue:us-east-1:111122223333:catalog" ] } ] }
  • 您負責判斷和管理適當的資料存取。由於對聯合查詢進行精細存取控制,建議您使用 AmazonAthenaFullAccess 受管政策。如果您想要使用自己的政策,您必須確保執行聯合查詢的使用者無法存取下列資源。

    • 在 Glue 連線中指定的 Lambda 連接器上的 lambda:InvokeFunction

    • IAM 中的溢出儲存貯體位置存取

    • 存取與聯合目錄相關的 Glue 連線

    • IAM 中的 Lake Formation 角色

使用主控台註冊您的連線

將您的連線註冊為 Glue Data Catalog
  1. 前往 https://console.aws.amazon.com/athena/ 開啟 Athena 主控台。

  2. 在導覽窗格中,選擇資料來源和目錄

  3. 資料來源清單中,選擇您建立的資料來源,以開啟資料來源詳細資訊頁面。

  4. 選擇開始使用AWS Lake Formation

    注意

    選擇此選項後,您必須自行管理您的 Lambda 函式。Athena 不會刪除您的 Lambda 函式。

  5. 對於資料目錄名稱,請提供您目錄的唯一名稱。

  6. 選擇 Lake Formation IAM 角色,其中該角色可授予 Lake Formation 調用 Lambda 函式的許可。請確保角色具有許可,如範例所示。

  7. 在文字方塊中,輸入 confirm 以刪除 Athena 資料來源,並將其取代為 Glue 資料目錄註冊。

    注意

    此動作會刪除您的 Athena 資料來源,並在其位置建立新的 Glue Data Catalog。此程序完成後,您可能需要更新存取資料來源的查詢,以改為參考新建立的 Glue 資料目錄。

  8. 選擇建立目錄並前往 Lake Formation。這會開啟 Lake Formation 主控台,您可以在其中管理目錄,並將許可授予目錄、資料庫和資料表上的使用者。