准备批量加载数据文件 - Amazon Timestream

有关与适用于 LiveAnalytics 的 Amazon Timestream 类似的功能,可以考虑使用适用于 InfluxDB 的 Amazon Timestream。适用于 InfluxDB 的 Amazon Timestream 提供简化的数据摄取和个位数毫秒级的查询响应时间,以实现实时分析。点击此处了解更多信息。

准备批量加载数据文件

源数据文件采用分隔符分隔值的形式。通常使用逗号分隔值(CSV)这一更具体的术语。有效的列分隔符包括逗号和竖线。记录之间以换行符分隔。文件必须存储在 Amazon S3 中。当创建新的批量加载任务时,源数据的位置由文件的 ARN 指定。文件包含标题。其中一列代表时间戳。至少还有一列代表度量。

用于批量加载的 S3 存储桶必须与用于批量加载的适用于 LiveAnalytics 的 Timestream 表位于同一区域。批量加载任务提交后,请勿向用于批量加载的 S3 存储桶添加或移除文件。有关使用 S3 存储桶的更多信息,请参阅 Amazon S3 入门

注意

某些应用程序(例如 Excel)生成的 CSV 文件可能包含与预期编码冲突的字节顺序标记(BOM)。通过编程方式处理时,适用于 LiveAnalytics 的 Timestream 批量加载任务会抛出错误,此类任务会引用带有 BOM 的 CSV 文件。为避免此情况,您可以删除 BOM,这是一种不可见字符。

例如,您可以使用 Notepad++ 等应用程序保存文件,这些应用程序允许您指定新的编码。您还可以使用编程方式:读取文件首行,移除该行中的字符,然后将新值写入文件的首行。

从 Excel 保存时,有多种 CSV 选项可供选择。使用不同的 CSV 选项进行保存可能有助于避免出现上述问题。但您应该检查结果,因为编码的更改可能会影响某些字符。

CSV 格式参数

当需要表示被格式参数保留的值时,应使用转义字符。例如,如果引号字符是双引号,要在数据中表示双引号,请在双引号前添加转义字符。

有关在创建批量加载任务时何时指定这些参数的信息,请参阅 创建批量加载任务

参数 选项
列分隔符 (逗号(“,”)| 竖线(“|”)| 分号(“;”)| 制表符(“/t”)| 空格(“ ”))
转义字符 none
引证字符 控制台:(双引号(")| 单引号('))
Null 值 空格(“ ”)
删除空格 控制台:(否 | 是)