Amazon S3 Tables 與 AWS 分析服務整合概觀 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon S3 Tables 與 AWS 分析服務整合概觀

若要讓 AWS 分析服務可存取您帳戶中的資料表,您可以將 Amazon S3 資料表儲存貯體與 Amazon SageMaker Lakehouse 整合。此整合可讓 AWS 分析服務自動探索和存取您的資料表資料。您可以透過這項整合來使用這些服務中的資料表:

注意

此整合使用 AWS Glue 和 AWS Lake Formation 服務,並可能產生 AWS Glue 請求和儲存成本。如需詳細資訊,請參閱AWS Glue 定價

在 S3 資料表上執行查詢則採用另外的定價。如需詳細資訊,請參閱您正在使用的查詢引擎定價資訊。

整合的運作方式

當您在主控台中建立資料表儲存貯體時,Amazon S3 會啟動下列動作,以整合您所選區域中的資料表儲存貯體與 AWS 分析服務:

  1. 建立新的 AWS Identity and Access Management (IAM) 服務角色,讓 Lake Formation 存取您所有的資料表儲存貯體。

  2. Lake Formation 會使用服務角色,在目前區域中註冊資料表儲存貯體。這可讓 Lake Formation 管理該區域中所有目前和未來資料表儲存貯體的存取、許可和管控。

  3. s3tablescatalog目錄新增至目前區域中 AWS Glue Data Catalog 的 。新增 s3tablescatalog 型錄可讓您在資料目錄中填入所有資料表儲存貯體、命名空間和資料表。

注意

這些動作會藉由 Amazon S3 主控台自動化。如果您以程式設計方式執行此整合,則必須手動採取所有這些動作。

您可以整合每個 AWS 區域的資料表儲存貯體一次。整合完成後,所有目前和未來的資料表儲存貯體、命名空間和資料表都會新增至該區域中 AWS Glue Data Catalog 的 。

下圖顯示 s3tablescatalog 目錄如何自動填入目前區域中的資料表儲存貯體、命名空間和資料表,以做為資料目錄中的對應物件。資料表儲存貯體會做為子目錄填入。資料表儲存貯體中的命名空間會做為其各自子目錄內的資料庫填入。資料表會作為其個別資料庫中的資料表填入。

資料表資源的呈現方式 AWS Glue Data Catalog。
許可權的運作方式。

我們建議您整合資料表儲存貯體與 AWS 分析服務,以便跨使用 AWS Glue Data Catalog 做為中繼資料存放區的服務使用資料表資料。整合可透過 進行精細存取控制 AWS Lake Formation。此安全方法表示,除了 AWS Identity and Access Management (IAM) 許可之外,您還必須在資料表上授予 IAM 主體 Lake Formation 許可,才能使用這些許可。

AWS Lake Formation中有兩種主要類型的權限:

  • 中繼資料存取權限可控制在 Data Catalog 中建立、讀取、更新和刪除中繼資料資料庫和資料表的能力。

  • 基礎資料存取權限可控制讀取和寫入資料目錄資源指向的基礎 Amazon S3 位置的能力。

Lake Formation 使用自己的許可模型和 IAM 許可模型的組合,控制對 Data Catalog 資源和基礎資料的存取:

  • 若要請求成功存取 Data Catalog 資源或基礎資料,則請求必須通過 IAM 和 Lake Formation 的許可權檢查。

  • IAM 許可控制對 Lake Formation 和 AWS Glue APIs存取,而 Lake Formation 許可控制對 Data Catalog 資源、Amazon S3 位置和基礎資料的存取。

Lake Formation 許可權僅適用於授予其獲授權的區域,且主體必須由資料湖管理員或其他具有必要權限的主體的授權,才能授予 Lake Formation 許可。

如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的 Lake Formation 許可概觀

請務必遵循 中的步驟,將 S3 Tables 與 AWS 分析服務整合以便您擁有適當的許可來存取 AWS Glue Data Catalog 和資料表資源,以及使用 AWS 分析服務。

後續步驟