适用于 InfluxDB 的 Timestream 作为目标

适用于 InfluxDB 的 Amazon Timestream 是一项托管的时间序列数据库服务 AWS ，它使用开源 InfluxDB 来运行实时应用程序。 APIs 该服务易于设置、操作和扩展，能够以个位数毫秒级响应时间提供查询。

确定 InfluxDB 的 Timestream 是否是适合您的用例的迁移目标的第一步是确定表的时间流的基数。 LiveAnalytics 我们开发了一个脚本，用于计算 Timestream 中表的基数。 LiveAnalytics此计算旨在实现两个目的：

检查基数是否小于 1000 万，这将有助于确定适用于 InfluxDB 的 Timestream 能否处理您的使用案例。
帮助您决定要使用哪种适用于 InfluxDB 的 Timestream 实例类型。

InfluxDB 中的基数是指 InfluxDB 存储桶中唯一测量值、标签和字段键组合的数量。请参阅适用于 InfluxDB 的 Timestream 关于基数管理的文档，以了解超过推荐限制会如何导致查询性能下降并增加内存消耗。在最终确定实例选择之前，请将预期的查询模式与代表性数据样本进行基准测试，以确保迁移后查询性能保持稳定。请注意内存密集型聚合查询，这些查询的行为可能与 Timestream 中的行为有所不同。 LiveAnalytics从 Timestream 迁移时 LiveAnalytics，请根据数据集的基数仔细选择您的 InfluxDB 实例规格，因为这会直接影响性能和资源需求。如果数据基数超过 1000 万，建议考虑其他目标。

基数计算脚本概述

基数计算脚本计算表的时间流的基数。 LiveAnalytics 如果基数小于 1000 万，脚本建议使用适用于 InfluxDB 的 Timestream 实例类型。使用默认架构映射，通过计算维度和度量名称的唯一组合总数计算基数。选择正确的行协议标签（等同于 Timestream 中的维度 LiveAnalytics）可帮助您自动索引数据并使用标签高效地筛选数据。该脚本还提供在计算基数时排除特定维度的选项。如果适用于您的情况，即在 SQL 查询中未使用某些维度进行数据筛选（特别是未将其用作谓词），则可将这些维度排除在基数计算之外。稍后，您可以在迁移的后续步骤中将它们作为字段（等同于 Timestream 中的度量 LiveAnalytics）摄取。

先决条件和安装

请参阅基数脚本的自述文件中的“先决条件”部分及安装说明。

基本用法

要确定数据库 example_database 中表 example_table 的基数，可按以下方式使用该脚本：

例


python3 cardinality.py \
    --table-name example_table \
    --database-name example_database

这会生成以下输出：


Cardinality of "example_database"."example_table": 160
Your recommended Timestream for InfluxDB type is: db.influx.medium

建议

该脚本会自动扫描整个表以计算基数，同时提供时间筛选选项，以实现最佳查询执行。当数据涉及一致的维度，且分析整个表中不同维度的变化会产生与分析特定时间范围相似的结果时，我们建议使用时间筛选器。此方法可确保高效且高性能的查询执行。

有关更多信息，请参阅基数脚本的自述文件。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

将 Timestream 数据导出到 Amazon S3

将数据从 Amazon S3 摄取到适用于 InfluxDB 的 Timestream 自动化系统