将 Amazon Redshift 数据仓库数据引入的限制 AWS Glue Data Catalog - AWS Lake Formation

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 Amazon Redshift 数据仓库数据引入的限制 AWS Glue Data Catalog

您可以使用 AWS Glue Data Catalog编目和管理对 Amazon Redshift 数据仓库中分析数据的访问权限。适用以下限制:

  • 在联合目录级别不支持跨账户共享。但是,您可以跨 AWS 账户越联合目录共享各个数据库和表。

  • 您必须具有跨账户版本设置版本 4 才能跨 AWS 账户越多个共享联合目录中的数据库或表。

  • Data Catalog 支持创建仅顶层目录。

  • 您只能在 Redshift 托管式存储(RMS)中更新目录的描述。

  • 不支持将联合目录以及联合目录中的数据库和表的权限设置到 IAMAllowedPrincipals 组。

  • 不支持通过 Athena、Amazon EMR Spark 等引擎对目录进行数据定义语言(DDL)操作,包括设置目录配置。

  • 不支持使用 Athena 对 RMS 表执行 DDL 操作。

  • 不支持创建物化视图,无论是通过 Athena、Apache Spark 还是通过 Amazon Redshift AWS Glue Data Catalog使用者。

  • Athena 不支持多目录体验。一次只能连接到一个特定目录。Athena 无法同时访问或查询多个目录。

  • 不支持通过 Athena 和 Amazon Redshift 对 Iceberg 表进行标记和分支操作。

  • 不支持对 RMS 表执行时间旅行查询。

  • 不支持带有数据湖表的多级目录。存储在 Amazon S3 中用于数据湖表的所有数据都必须位于默认数据中 AWS Glue Data Catalog,并且不能组织成多级目录。

  • 在 Amazon Redshift 中,数据共享不会添加到已注册的命名空间。集群和命名空间是同义词,一旦您将集群发布到中 AWS Glue Data Catalog,就无法添加新数据。

  • 开启的 Amazon EMR EC2 不支持通过 RMS 表和 Amazon S3 表进行联接。只有 EMR Serverless 才支持此功能。

  • 不支持外部架构和表。

  • 只能从 AWS Glue Iceberg REST 目录中的扩展端点访问 RMS 表。

  • 连接到 I AWS Glue ceberg REST 目录的第三方引擎无法访问 Hive 表。

  • 通过 Spark 对 RMS 表使用 read_committed 隔离级别将得到支持。

  • Redshift 数据库名称在中被视为不区分大小写 AWS Glue Data Catalog,限制为 128 个字符,并且可以是带有破折号 (-) 和下划线 (_) 的字母数字。

  • 目录名称不区分大小写,限制为 50 个字符,并且可以是带连字符(-)和下划线(_)的字母数字字符。

  • Amazon Redshift 不支持使用 Lake Formation SQL 风格的 GRANT 和 REVOKE 命令来管理发布到 AWS Glue Data Catalog的表的访问权限。

  • 不会强制执行附加到创建者(来源)Amazon Redshift 集群的行级安全和动态数据掩蔽策略。相反,将对共享数据实施 Lake Formation 中定义的访问权限。

  • 不支持对表链接执行数据定义语言(DDL)和数据操作语言(DML)操作。

  • 如果未正确转义保留的关键字,则会导致失败或错误。

  • 不支持在多目录场景中对数据进行加密。