多维数据布局排序 - Amazon Redshift

从 2025 年 11 月 1 日起,Amazon Redshift 将不再支持创建新的 Python UDF。如果您想要使用 Python UDF,请在该日期之前创建 UDF。现有的 Python UDF 将继续正常运行。有关更多信息,请参阅博客文章

多维数据布局排序

多维数据布局排序键是一种基于工作负载中重复谓词的 AUTO 排序键。如果您的工作负载具有重复谓词,那么 Amazon Redshift 可以通过将满足重复谓词的数据行放在同一位置来提高表扫描性能。多维数据布局排序键不是按照严格的列顺序存储表数据,而是通过分析工作负载中出现的重复谓词来存储数据。在一个工作负载中可以找到多个重复谓词。根据您的工作负载,这种排序键可以提高许多谓词的性能。Amazon Redshift 会自动确定是否应将这种排序键方法用于使用 AUTO 排序键定义的表。

例如,假设您有一个按列顺序排列数据的表。可能需要检查许多数据块,以确定它们是否满足工作负载中的谓词。但是,如果数据是按谓词顺序存储在磁盘上的,那么为满足查询需要扫描的数据块就会减少。在这种情况下,使用多维数据布局排序键是有益的。

要查看查询是否使用了多维数据布局键,请查看 SYS_QUERY_DETAIL 视图的 step_attribute 列。当值为 multi-dimensional 时,多维数据布局用于查询。

要防止 Amazon Redshift 使用多维数据布局排序键,请选择除 SORTKEY AUTO 之外的其他表排序键选项。有关 SORTKEY 选项的更多信息,请参阅 CREATE TABLE