了解 EXPLAIN ANALYZE 中的 DPU - Amazon Aurora DSQL

了解 EXPLAIN ANALYZE 中的 DPU

Aurora DSQL 在 EXPLAIN ANALYZE VERBOSE 计划输出中提供语句级分布式处理单元(DPU)信息,以便您能够更深入地了解开发过程中的查询成本。此部分将阐释 DPU 的定义以及如何在 EXPLAIN ANALYZE VERBOSE 输出中解读它们。

什么是 DPU?

分布式处理单元(DPU)是 Aurora DSQL 中用于量化工作完成量的标准化度量单位,由以下部分组成:

  • ComputeDPU – 执行 SQL 查询所花费的时间

  • ReadDPU – 从存储中读取数据所使用的资源

  • WriteDPU – 向存储中写入数据所使用的资源

  • MultiRegionWriteDPU – 用于在多区域配置中将写入内容复制到对等集群的资源。

EXPLAIN ANALYZE VERBOSE 中的 DPU 使用量

Aurora DSQL 对 EXPLAIN ANALYZE VERBOSE 进行了扩展,以便在输出末尾包含语句级 DPU 使用量估算值。这可让您即时了解查询成本,并帮助您识别工作负载成本驱动因素、优化查询性能,并更准确地预测资源使用量。

以下示例展示如何解释 EXPLAIN ANALYZE VERBOSE 输出中包含的语句级 DPU 估算值。

示例 1:SELECT 查询

EXPLAIN ANALYZE VERBOSE SELECT * FROM test_table;
QUERY PLAN
----------------------------------------------------
Index Only Scan using test_table_pkey on public.test_table  (cost=125100.05..171100.05 rows=1000000 width=36) (actual time=2.973..4.482 rows=120 loops=1)
  Output: id, context
  -> Storage Scan on test_table_pkey (cost=125100.05..171100.05 rows=1000000 width=36) (actual rows=120 loops=1)
      Projections: id, context
      -> B-Tree Scan on test_table_pkey (cost=125100.05..171100.05 rows=1000000 width=36) (actual rows=120 loops=1)
Query Identifier: qymgw1m77maoe
Planning Time: 11.415 ms
Execution Time: 4.528 ms
Statement DPU Estimate:
  Compute: 0.01607 DPU
  Read: 0.04312 DPU
  Write: 0.00000 DPU
  Total: 0.05919 DPU

在此示例中,SELECT 语句执行了一次仅索引扫描,因此大部分成本来自读取 DPU(0.04312)和计算 DPU(0.01607),前者表示从存储中检索数据所使用的资源,后者反映处理并返回结果所使用的计算资源。由于该查询未修改数据,因此不存在写入 DPU。总 DPU(0.05919)为计算 DPU、读取 DPU 与写入 DPU 的总和。

示例 2:INSERT 查询

EXPLAIN ANALYZE VERBOSE INSERT INTO test_table VALUES (1, 'name1'), (2, 'name2'), (3, 'name3');
QUERY PLAN
----------------------------------------------------
Insert on public.test_table  (cost=0.00..0.04 rows=0 width=0) (actual time=0.055..0.056 rows=0 loops=1)
  ->  Values Scan on "*VALUES*"  (cost=0.00..0.04 rows=3 width=122) (actual time=0.003..0.008 rows=3 loops=1)
        Output: "*VALUES*".column1, "*VALUES*".column2
Query Identifier: jtkjkexhjotbo
Planning Time: 0.068 ms
Execution Time: 0.543 ms
Statement DPU Estimate:
  Compute: 0.01550 DPU
  Read: 0.00307 DPU (Transaction minimum: 0.00375)
  Write: 0.01875 DPU (Transaction minimum: 0.05000)
  Total: 0.03732 DPU

此语句主要执行写入操作,因此大部分成本与写入 DPU 相关。计算 DPU(0.01550)表示处理并插入值所使用的计算资源。读取 DPU(0.00307)反映系统轻量级读取操作(如目录查询或索引检查)所使用的资源。

请注意读取 DPU 和写入 DPU 旁边显示的事务最低计费标准。这些值代表单次事务的基准成本,仅在操作涉及数据读取或写入时适用。这并不意味着每个事务都会自动产生 0.00375 读取 DPU 或 0.05 写入 DPU 的费用。相反,这些最低计费标准仅在事务级别进行成本聚合时适用,且仅当该事务内实际发生读取或写入操作时生效。由于范围差异,EXPLAIN ANALYZE VERBOSE 中的语句级估算值可能与 CloudWatch 或计费数据中报告的事务级指标不完全一致。

利用 DPU 信息进行优化

单语句 DPU 估算为您提供了一种强大的查询优化方式,其价值不仅限于缩短执行时间。常见使用案例包括:

  • 成本感知:了解某一查询相对于其他查询的成本高低。

  • 架构优化:比较索引或架构变更对性能与资源效率产生的影响。

  • 预算规划:基于观测到的 DPU 使用量来估算工作负载成本。

  • 查询比较:根据相对 DPU 使用量来评估替代查询方法。

解释 DPU 信息

使用 EXPLAIN ANALYZE VERBOSE 中的 DPU 数据时,请记住以下最佳实践:

  • 定向地使用 DPU 数据:将报告的 DPU 值视为了解查询相对成本的依据,而非与 CloudWatch 指标或计费数据完全一致的精确值。预计会出现差异,因为 EXPLAIN ANALYZE VERBOSE 报告的是语句级成本,而 CloudWatch 聚合的是事务级活动。此外,CloudWatch 还包括 EXPLAIN ANALYZE VERBOSE 有意排除的后台操作(例如 ANALYZE 或压缩)和事务开销(BEGIN/COMMIT)。

  • 在分布式系统中,DPU 在不同的运行间存在波动是正常现象,并不表示出现错误。缓存、执行计划更改、并发性或数据分布偏移等因素都可能导致同一查询在不同的运行时消耗的资源量存在差异。

  • 批量处理小型操作:如果您的工作负载发出许多小型语句,建议将其批量合并为大型操作(不超过 10 MB)。这可减少四舍五入开销,并生成更具参考价值的成本估算值。

  • 用于调优,而非计费:EXPLAIN ANALYZE VERBOSE 中的 DPU 数据专为成本感知、查询调优和优化设计,并非计费级指标。要获取权威的成本和使用量数据,请始终以 CloudWatch 指标或月度账单报告为准。