Nodestream - Amazon Neptune

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Nodestream

Nodestream es un marco para tratar el modelado semántico de datos como un gráfico. Se ha diseñado para ser flexible y extensible, lo que permite definir la forma de recopilar y modelar los datos como un gráfico. Utiliza un enfoque basado en canalizaciones para determinar el modo en que se recopilan y procesan los datos, y establece una forma de definir cómo debe actualizarse el gráfico cuando cambia el esquema. Todo esto se hace mediante un archivo de configuración sencillo y legible en formato yaml. Para ello, Nodestream utiliza una serie de conceptos básicos, entre los que se incluyen canalizaciones, extractores, transformadores, filtros, intérpretes, interpretaciones y migraciones.

A partir de Nodestream 0.12, Amazon Neptune es compatible tanto con Neptune Database y Neptune Analytics.

Consulte la documentación de Nodestream para obtener más información sobre cómo configurar y usar Nodestream con Neptune: compatibilidad de Nodestream con Amazon Neptune.

Nodestream con Neptune actualmente admite canalizaciones de ETL estándar, así como canalizaciones de tiempo de vida (TTL). Las canalizaciones de ETL permiten la ingesta masiva de datos en Neptune a partir de una gama mucho más amplia de orígenes y formatos de datos que la que era posible anteriormente en Neptune, entre los que se incluyen:

Nodestream es totalmente compatible con la autenticación de IAM cuando se conecta a Amazon Neptune, siempre que las credenciales estén configuradas correctamente. Consulte la guía de credenciales de boto3 para obtener más información sobre cómo configurar correctamente las credenciales.

El mecanismo de TTL de Nodestream también habilita nuevas capacidades que antes no estaban disponibles en Neptune. Al anotar los elementos del gráfico ingeridos con marcas de tiempo, Nodestream puede crear canalizaciones que caducan automáticamente y eliminan los datos que hayan superado la vida útil configurada.