使用 UNLOAD,将查询结果从适用于 LiveAnalytics 的 Timestream 导出至 S3 - Amazon Timestream

有关与适用于 LiveAnalytics 的 Amazon Timestream 类似的功能,可以考虑使用适用于 InfluxDB 的 Amazon Timestream。适用于 InfluxDB 的 Amazon Timestream 提供简化的数据摄取和个位数毫秒级的查询响应时间,以实现实时分析。点击此处了解更多信息。

使用 UNLOAD,将查询结果从适用于 LiveAnalytics 的 Timestream 导出至 S3

适用于 LiveAnalytics 的 Amazon Timestream 现支持使用 UNLOAD 语句,以经济高效且安全的方式将查询结果导出至 Amazon S3。使用 UNLOAD 语句,您现在能够以 Apache Parquet 或逗号分隔值(CSV)格式将时间序列数据导出至选定的 S3 存储桶,从而灵活地与其他服务结合使用,以存储、合并和分析时间序列数据。UNLOAD 语句允许您以压缩方式导出数据,从而减少传输的数据和所需的存储空间。UNLOAD 还支持在导出数据时根据所选属性进行分区,从而提升性能并缩短下游服务访问数据的处理时间。此外,您还可以使用 Amazon S3 托管密钥(SSE-S3)或 AWS 密钥管理服务(AWS KMS)托管密钥(SSE-KMS)对导出的数据进行加密。

适用于 LiveAnalytics 的 Timestream 中 UNLOAD 的优势

使用 UNLOAD 语句的主要优势如下。

  • 操作简便:使用 UNLOAD 语句,您可以在单个查询请求中以 Apache Parquet 或 CSV 格式导出数千兆字节的数据,既能灵活选择最适合下游处理需求的格式,又可轻松构建数据湖。

  • 安全且经济高效UNLOAD 语句支持以压缩方式将数据导出至 S3 存储桶,并使用客户托管的密钥对数据进行加密(SSE-KMS 或 SSE_S3),从而降低数据存储成本并防范未经授权的访问。

  • 性能:使用 UNLOAD 语句,可在将数据导出至 S3 存储桶时进行分区。对数据进行分区使下游服务能够并行处理数据,从而缩短其处理时间。此外,下游服务仅需处理所需数据,从而减少所需的处理资源,进而降低相关成本。

适用于 LiveAnalytics 的 Timestream 中 UNLOAD 使用案例

您可以使用 UNLOAD 语句,将数据写入 S3 存储桶。

  • 构建数据仓库:您可以将数千兆字节的查询结果导出至 S3 存储桶,并更轻松地将时间序列数据添加到数据湖中。您可以使用 Amazon Athena 和 Amazon Redshift 等服务,将时间序列数据与其他相关数据结合,从而获得复杂的业务见解。

  • 构建 AI 和 ML 数据管道UNLOAD 语句使您能够轻松构建用于机器学习模型的数据管道,这些管道可访问时间序列数据,从而更便捷地将时间序列数据与 Amazon SageMaker 和 Amazon EMR 等服务结合使用。

  • 简化 ETL 处理:将数据导出至 S3 存储桶可简化数据提取、转换、加载(ETL)操作流程,使您能够无缝使用第三方工具或 AWS 服务(如 AWS Glue)对数据进行处理和转换。