本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
故障排除 AWS Clean Rooms
本节介绍使用时可能出现的一些常见问题 AWS Clean Rooms 以及如何解决这些问题。
事务
查询所引用的一个或多个表不能由其关联的服务角色访问。 table/role 所有者必须向服务角色授予对表的访问权限。
-
验证服务角色的权限是否已按要求设置。有关更多信息,请参阅设置 AWS Clean Rooms。
其中一个底层数据集的文件格式不受支持。
-
确保您的数据集采用支持的文件格式之一:
-
Parquet
-
RCFile
-
TextFile
-
SequenceFile
-
RegexSerde
-
OpenCSV
-
AVRO
-
JSON
有关更多信息,请参阅 的数据格式 AWS Clean Rooms。
-
使用 Clean Rooms 加密计算时,查询结果不如预期。
如果您使用 Clean Rooms 加密计算 (C3R),请验证您的查询是否正确使用了加密列:
-
sealed 列仅用于 SELECT 子句。
-
fingerprint 列仅用于 JOIN 子句(以及某些条件下的 GROUP BY 子句)。
-
只有在协作设置要求的情况下,才 JOINing 具有相同名称的 fingerprint 列。
有关更多信息,请参阅加密计算 Clean Rooms和加密计算中的列类型 Clean Rooms。
AWS Clean Rooms Spark SQL:缺少分区
如果您将 AWS Clean Rooms Spark SQL 引擎用于分区表 S3 表,则中的所有分区还 AWS Glue Data Catalog 必须在 S3 中包含数据。引擎使用 Spark 设置 spark.sql.files.ignoreMissingFiles=False
有关更多信息,请参阅 https://spark.apache.org/docs/latest/sql-data-sources-generic-options.html# ignore-missing-files
如果遇到此错误,您将收到以下错误消息:"Missing
partition data: One of the configured tables is partitioned and one or more of the
partitions does not have data".
将您在 Amazon S3 中的数据与表中列出的分区 AWS Glue Data Catalog 进行比较。删除 S3 中没有相应数据的分区。