neptune.read ()

Neptune unterstützt ein CALL Verfahren neptune.read zum Lesen von Daten aus Amazon S3 und zum Ausführen einer OpenCypher-Abfrage (Lesen, Einfügen, Aktualisieren) unter Verwendung der Daten. Die Prozedur gibt jede Zeile in der Datei als deklarierte Ergebnisvariablenzeile zurück. Es verwendet die IAM-Anmeldeinformationen des Anrufers, um auf die Daten in Amazon S3 zuzugreifen. Informationen Verwaltung der Berechtigungen für neptune.read () zum Einrichten der Berechtigungen finden Sie unter. Die AWS Region des Amazon S3 S3-Buckets muss sich in derselben Region befinden, in der sich die Instance befindet. Derzeit werden regionsübergreifende Lesevorgänge nicht unterstützt.

Syntax


CALL neptune.read(
  {
    source: "string",
    format: "parquet/csv",
    concurrency: 10
  }
)
YIELD row
...

Eingaben

source (erforderlich) — Amazon S3 S3-URI zu einem einzelnen Objekt. Das Amazon S3 S3-Präfix für mehrere Objekte wird nicht unterstützt.
Format (erforderlich) — parquet und csv werden unterstützt.
- Weitere Informationen zum unterstützten Parquet-Format finden Sie unterUnterstützte Parquet-Spaltentypen.
- Weitere Informationen zum unterstützten CSV-Format finden Sie unterGremlin-Ladedatenformat.
Parallelität (optional) — Typ: Ganzzahl 0 oder höher. Standard: 0 Gibt die Anzahl der Threads an, die zum Lesen der Datei verwendet werden sollen. Wenn der Wert 0 ist, wird die maximale Anzahl von Threads verwendet, die von der Ressource zulässig ist. Für Parquet wird empfohlen, die Einstellung auf eine bestimmte Anzahl von Zeilengruppen festzulegen.

Outputs

Der Befehl neptune.read gibt zurück:

row - Typ: MAP
- Jede Zeile in der Datei, wobei die Schlüssel die Spalten und die Werte die in jeder Spalte gefundenen Daten sind.
- Sie können auf die Daten jeder Spalte wie bei einer Eigenschaft access (row.col) zugreifen.

Bewährte Methoden für neptune.read ()

Neptune S3-Lesevorgänge können speicherintensiv sein. Bitte verwenden Sie Instance-Typen, die sich gut für Produktions-Workloads eignen, wie unter Instance-Typen für Amazon Neptune auswählen beschrieben.

Die Speichernutzung und die Leistung von neptune.read() Anfragen werden durch eine Vielzahl von Faktoren wie Dateigröße, Anzahl der Spalten, Anzahl der Zeilen und Dateiformat beeinflusst. Je nach Struktur funktionieren kleine Dateien (z. B. CSV-Dateien mit 100 MB oder weniger, Parquet-Dateien mit 20 MB oder weniger) möglicherweise zuverlässig auf den meisten produktionsgeeigneten Instance-Typen, wohingegen größere Dateien möglicherweise viel Speicherplatz benötigen, den kleinere Instance-Typen nicht bereitstellen können.

Beim Testen dieser Funktion wird empfohlen, mit kleinen Dateien zu beginnen und diese schrittweise zu skalieren, um sicherzustellen, dass Ihr Lese-Workload an Ihre Instance-Größe angepasst werden kann. Wenn Sie feststellen, dass neptune.read() Anfragen zu Ausnahmen wegen unzureichenden Speichers oder zu Instanzneustarts führen, sollten Sie erwägen, Ihre Dateien in kleinere Teile aufzuteilen, die Dateikomplexität zu reduzieren oder ein Upgrade auf größere Instance-Typen durchzuführen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Erweiterungen

Beispiele für Abfragen mit Parquet