

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Nodestream
<a name="tools-Nodestream"></a>

 [Nodestream](https://nodestream-proj.github.io/docs/docs/intro/) 是一个用于将数据以图形的形式进行语义建模的框架。它具备高度的灵活性和可扩展性，支持定义数据的收集方式，以及如何将数据建模为图结构。它采用基于管道的方式来定义数据的收集和处理流程，并提供机制来指定当架构更改时图形应如何更新。以上所有操作都通过一个简单、易懂的 YAML 配置文件完成。为实现上述功能，Nodestream 引入了多个核心概念，包括管道、提取器、转换器、过滤器、解释器、解释规则和迁移工具。

 从 [Nodestream 0.12](https://nodestream-proj.github.io/docs/blog/2024/04/05/nodestream-0-12/) 开始，该框架已支持 Amazon Neptune，包括 [Neptune Database 和 Neptune Analytics](https://nodestream-proj.github.io/docs/docs/databases/neptune/)。

 请查看 Nodestream 文档，详细了解如何配置和使用集成的 Nodestream 与 Neptune：[Nodestream 对 Amazon Neptune 的支持](https://nodestream-proj.github.io/docs/docs/databases/neptune/)。

 使用 Neptune 的 Nodestream 目前支持标准的 ETL 管道以及生存时间（TTL）管道。ETL 管道支持从远比 Neptune 以往支持范围更广泛的数据来源和格式向 Neptune 批量摄取数据，包括：
+  [软件物料清单](https://nodestream-proj.github.io/docs/docs/official-plugins/sbom/) 
+  [各类文件：CSV、JSON、JSONL、Parquet、txt 和 yaml](https://nodestream-proj.github.io/docs/docs/reference/extractors/) 
+  [Kafka](https://nodestream-proj.github.io/docs/docs/reference/extractors/#streamextractor) 
+  [Athena](https://nodestream-proj.github.io/docs/docs/reference/extractors/#athenaextractor) 
+  [REST API](https://nodestream-proj.github.io/docs/docs/reference/extractors/#simpleapiextractor) 

 只要凭证配置正确，Nodestream 在连接到 Amazon Neptune 时完全支持 IAM 身份验证。有关正确配置凭证的更多信息，请参阅 [boto3 凭证指南](https://boto3.amazonaws.com/v1/documentation/api/latest/guide/credentials.html#configuring-credentials)。

 [Nodestream 的 TTL 机制](https://nodestream-proj.github.io/docs/docs/tutorials-intermediate/removing-data/)还带来了此前 Neptune 中没有的新能力。通过为导入的图元素添加时间戳，Nodestream 可以构建自动过期机制，在数据超过设定生命周期后，自动将其清理移除。