本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon S3 Tables 與 AWS 分析服務整合概觀
若要讓 AWS 分析服務可存取您帳戶中的資料表,您可以將 Amazon S3 資料表儲存貯體與 Amazon SageMaker Lakehouse 整合。此整合可讓 AWS 分析服務自動探索和存取您的資料表資料。您可以透過這項整合來使用這些服務中的資料表:
注意
此整合使用 AWS Glue 和 AWS Lake Formation 服務,並可能產生 AWS Glue 請求和儲存成本。如需詳細資訊,請參閱AWS Glue 定價
在 S3 資料表上執行查詢則採用另外的定價。如需詳細資訊,請參閱您正在使用的查詢引擎定價資訊。
整合的運作方式
當您在主控台中建立資料表儲存貯體時,Amazon S3 會啟動下列動作,以整合您所選區域中的資料表儲存貯體與 AWS 分析服務:
-
建立新的 AWS Identity and Access Management (IAM) 服務角色,讓 Lake Formation 存取您所有的資料表儲存貯體。
-
Lake Formation 會使用服務角色,在目前區域中註冊資料表儲存貯體。這可讓 Lake Formation 管理該區域中所有目前和未來資料表儲存貯體的存取、許可和管控。
-
將
s3tablescatalog目錄新增至目前區域中 AWS Glue Data Catalog 的 。新增s3tablescatalog型錄可讓您在資料目錄中填入所有資料表儲存貯體、命名空間和資料表。
注意
這些動作會藉由 Amazon S3 主控台自動化。如果您以程式設計方式執行此整合,則必須手動採取所有這些動作。
您可以整合每個 AWS 區域的資料表儲存貯體一次。整合完成後,所有目前和未來的資料表儲存貯體、命名空間和資料表都會新增至該區域中 AWS Glue Data Catalog 的 。
下圖顯示 s3tablescatalog 目錄如何自動填入目前區域中的資料表儲存貯體、命名空間和資料表,以做為資料目錄中的對應物件。資料表儲存貯體會做為子目錄填入。資料表儲存貯體中的命名空間會做為其各自子目錄內的資料庫填入。資料表會作為其個別資料庫中的資料表填入。
許可權的運作方式。
我們建議您整合資料表儲存貯體與 AWS 分析服務,以便跨使用 AWS Glue Data Catalog 做為中繼資料存放區的服務使用資料表資料。整合可透過 進行精細存取控制 AWS Lake Formation。此安全方法表示,除了 AWS Identity and Access Management (IAM) 許可之外,您還必須在資料表上授予 IAM 主體 Lake Formation 許可,才能使用這些許可。
AWS Lake Formation中有兩種主要類型的權限:
-
中繼資料存取權限可控制在 Data Catalog 中建立、讀取、更新和刪除中繼資料資料庫和資料表的能力。
-
基礎資料存取權限可控制讀取和寫入資料目錄資源指向的基礎 Amazon S3 位置的能力。
Lake Formation 使用自己的許可模型和 IAM 許可模型的組合,控制對 Data Catalog 資源和基礎資料的存取:
-
若要請求成功存取 Data Catalog 資源或基礎資料,則請求必須通過 IAM 和 Lake Formation 的許可權檢查。
-
IAM 許可控制對 Lake Formation 和 AWS Glue APIs存取,而 Lake Formation 許可控制對 Data Catalog 資源、Amazon S3 位置和基礎資料的存取。
Lake Formation 許可權僅適用於授予其獲授權的區域,且主體必須由資料湖管理員或其他具有必要權限的主體的授權,才能授予 Lake Formation 許可。
如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的 Lake Formation 許可概觀。
請務必遵循 中的步驟,將 S3 Tables 與 AWS 分析服務整合以便您擁有適當的許可來存取 AWS Glue Data Catalog 和資料表資源,以及使用 AWS 分析服務。