启用 Amazon S3 表类数据存储服务集成 - AWS Lake Formation

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

启用 Amazon S3 表类数据存储服务集成

您可以使用 Amazon S3 控制台创建 Amazon S3 表类数据存储服务存储桶,并将其与 AWS 分析服务集成。有关更多信息,请参阅将 Amazon S3 表类数据存储服务与 AWS 分析服务配合使用

在中 AWS Lake Formation,您可以启用 Amazon S3 表格与 AWS Glue Data Catalog Lake Formation 控制台的集成,也可以 AWS Lake Formation 使用 Lake Formation 控制台或使用 AWS CLI。

  1. 打开 Lake Formation 控制台,网址为https://console.aws.amazon.com/lakeformation/

  2. 在导航窗格的 Data Catalog 下,选择目录

  3. 目录页面上选择启用 S3 表集成

    目录页面上的启用 S3 表集成选项。
  4. 选择一个具有所需权限的 IAM 角色,供 Lake Formation 代入,以便向分析查询引擎提供凭证。有关该角色访问数据所需的权限,请参阅先决条件部分的step3-permissions

    使用 IAM 角色启用 S3 集成屏幕。
  5. 选择支持外部引擎以完全表访问权限访问 Amazon S3 位置的数据选项。当您为第三方引擎启用完全表访问权限时,Lake Formation 将直接向第三方引擎返回凭证,而无需执行 IAM 会话标签验证。这意味着您无法对要访问的表应用 Lake Formation 精细访问控制。

  6. 请选择启用。S3 表的新目录已添加到目录列表中。启用 S3 表目录集成后,该服务会向 Lake Formation 注册 S3 表存储桶的数据位置。

  7. 选择目录以查看目录对象并向其他主体授予权限。

    S3 表目录

    要创建多级目录,请参阅《Amazon Simple Storage Service 用户指南》中的创建表存储桶部分。

  1. 将 S3 表目录注册为 Lake Formation 数据位置。

    aws lakeformation register-resource \ --resource-arn 'arn:aws:s3tables:us-east-1:123456789012:bucket/*' \ --role-arn 'arn:aws:iam::123456789012:role/LakeFormationDataAccessRole' \ --with-federation --with-privileged-access
  2. 创建目录。

    aws glue create-catalog --cli-input-json file://input.json '{ "Name": "s3tablescatalog", "CatalogInput" : { "FederatedCatalog": { "Identifier": "arn:aws:s3tables:us-east-1:123456789012:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [], "CreateTableDefaultPermissions": [] } }'