parquet-mem-cache-size - Amazon Timestream

要获得与亚马逊 Timestream 类似的功能 LiveAnalytics,可以考虑适用于 InfluxDB 的亚马逊 Timestream。适用于 InfluxDB 的 Amazon Timestream 提供简化的数据摄取和个位数毫秒级的查询响应时间,以实现实时分析。点击此处了解更多信息。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

parquet-mem-cache-size

参数详情
默认 20%的系统内存
允许的值 百分比(例如20%)或绝对数字(0 — 1,610,612,736,000)
类别 内存管理/缓存

详细说明:

设置专用于在内存中缓存 Parquet 文件数据的最大内存量。该缓存存储最近访问的 Parquet 数据块,从而大大减少了重复查询相同数据的读取延迟。这是最具影响力的性能参数之一。 read/query

影响:

  • 太低:频繁的缓存错过会强制从对象存储中读取,从而显著增加查询延迟(网络 I/O 与内存访问)。

  • 过高:留下的内存不足以用于查询执行、WAL 缓冲区和系统进程。

  • 最佳:通常占实例总内存的 15-25%,具体取决于工作集的大小。

按实例大小划分的建议:

实例大小建议
实例类型 内存(GiB) 建议值 大约。GiB 理由
db.influx.medium 8 15%或 1,073,741,824 ~1.2 缓存最少;内存不足
db.influx.large 16 20% ~3.2 默认值是适当的
db.influx.xlarge 32 20% ~6.4 有意义的缓存大小
db.influx.2xlarge 64 20% ~12.8 良好的工作套装覆盖范围
db.influx.4xlarge 128 25% ~32 用于分析的大型缓存
db.influx.8xlarge 256 25% ~64 大量缓存
db.influx.12xlarge 384 25% ~96 支持非常大的工作集
db.influx.16xlarge 512 25% ~128 海量缓存容量
db.influx.24xlarge 768 25% ~192 最大实例的最大缓存