自动数据库优化 - Amazon Redshift

从补丁 198 开始,Amazon Redshift 将不再支持创建新的 Python UDF。现有的 Python UDF 将继续正常运行至 2026 年 6 月 30 日。有关更多信息,请参阅博客文章

自动数据库优化

Amazon Redshift 提供了一组自动执行的功能,统称为自主处理,此类功能可提升性能、减少人工维护并优化资源使用。自主处理利用机器学习和后台进程来高效地管理数据库操作,同时自动执行许多例行维护任务来减少数据库管理员工作负载。

下表详细介绍 Amazon Redshift 的自主处理功能:

自主处理功能 说明

自动 vacuum 排序

Amazon Redshift 根据观测到的查询模式自动重组表数据,以确保最佳排序顺序。默认情况下,对于具有指定排序键的表,此功能处于启用状态。有关更多信息,请参阅 自动表排序

自动 vacuum 删除

Amazon Redshift 自动运行 vacuum 操作,以便从已删除的行中回收空间并对数据进行排序。有关自动 vacuum 删除操作的更多信息,请参阅自动 vacuum 删除

自动表优化

Amazon Redshift 监控查询性能和表元数据,以自动确定表的最佳排序键和分配键,并选择在向表添加行时应用于数据值列的压缩类型。有关更多信息,请参阅自动表优化压缩编码

自动分析

当表中的数据发生变化时,Amazon Redshift 会自动分析表,确保查询计划程序拥有最佳执行计划的最新信息。有关自动分析操作的更多信息,请参阅自动分析

自动实体化视图

Amazon Redshift 根据观测到的查询模式自动创建和刷新实体化视图。这可减少用户手动创建或刷新视图的需求,以便从更快的查询响应中受益。有关实体化视图的更多信息,请参阅 Amazon Redshift 中的实体化视图

这些自主处理功能在默认情况下处于启用状态,并在低流量时段自动在后台运行,以优化集群的性能。您可以参考《Amazon Redshift 管理指南》中的默认参数值来配置自动功能。

对于流量持续较高的集群或工作组,我们建议启用额外的计算资源来确保持续优化。有关更多信息,请参阅 分配额外的计算资源来执行自动数据库优化