Voraussetzungen Einschränkungen Einen Neptune-Cluster einrichten Einrichtung eines AWS Glue Data Catalog Leistung Pass-Through-Abfragen Weitere Ressourcen

Amazon Athena Neptune Konnektor

Amazon Neptune ist ein schneller, zuverlässiger, vollständig verwalteter Graph-Datenbankservice, mit dem es ganz einfach ist, Anwendungen zu erstellen und auszuführen, die mit stark verbundenen Datensätzen arbeiten. Die speziell entwickelte, leistungsstarke Diagrammdatenbank-Engine von Neptune speichert Milliarden von Beziehungen optimal und fragt Diagramme mit einer Latenz von nur Millisekunden ab. Weitere Informationen finden Sie unter Neptune-Benutzerhandbuch.

Der Amazon Athena Neptune-Konnektor ermöglicht Athena die Kommunikation mit Ihrer Neptune-Graphdatenbank-Instance, sodass Ihre Neptune-Diagrammdaten über SQL-Abfragen zugänglich sind.

Dieser Konnektor verwendet keine Glue Connections, um die Konfigurationseigenschaften in Glue zu zentralisieren. Die Verbindungskonfiguration erfolgt über Lambda.

Wenn Sie Lake Formation in Ihrem Konto aktiviert haben, AWS Serverless Application Repository muss die IAM-Rolle für Ihren Athena Federated Lambda Connector, den Sie in der bereitgestellt haben, Lesezugriff in Lake Formation auf den haben. AWS Glue Data Catalog

Voraussetzungen

Die Verwendung des Neptune-Konnektors erfordert die folgenden drei Schritte.

Einen Neptune-Cluster einrichten
Einrichtung eines AWS Glue Data Catalog
Bereitstellen des Konnektors für Ihren AWS-Konto. Für weitere Informationen siehe Eine Datenquellenverbindung erstellen oder Verwenden Sie den AWS Serverless Application Repository , um einen Datenquellenconnector bereitzustellen. Weitere Informationen zur Bereitstellung des Neptune-Connectors finden Sie unter Bereitstellen des Amazon Athena Neptune Connectors auf .com. GitHub

Einschränkungen

Derzeit weist der Neptune-Konnektor die folgende Einschränkung auf.

Das Projizieren von Spalten, einschließlich des Primärschlüssels (ID), ist nicht unterstützt.

Einen Neptune-Cluster einrichten

Wenn Sie keinen vorhandenen Amazon Neptune-Cluster- und Eigenschaftsgraph-Datensatz haben, den Sie verwenden möchten, müssen Sie einen einrichten.

Stellen Sie sicher, dass Sie über einen Internet-Gateway und einen NAT-Gateway in der VPC verfügen, die Ihren Neptune-Cluster hostet. Die privaten Subnetze, die die Lambda-Funktion des Neptune-Konnektors verwendet, sollten über diesen NAT-Gateway eine Verbindung zum Internet haben. Die Lambda-Funktion des Neptune-Konnektors verwendet das NAT-Gateway für die Kommunikation mit. AWS Glue

Anweisungen zum Einrichten eines neuen Neptune-Clusters und zum Laden mit einem Beispieldatensatz finden Sie unter Sample Neptune Cluster Setup auf .com. GitHub

Einrichtung eines AWS Glue Data Catalog

Im Gegensatz zu herkömmlichen relationalen Datenspeichern verwenden Neptune Graph DB-Knoten und -Edges kein festgelegtes Schema. Jeder Eintrag kann unterschiedliche Felder und Datentypen haben. Da der Neptune-Konnektor jedoch Metadaten aus dem abruft AWS Glue Data Catalog, müssen Sie eine AWS Glue Datenbank erstellen, die Tabellen mit dem erforderlichen Schema enthält. Nachdem Sie die AWS Glue -Datenbank und -Tabellen erstellt haben, kann der Konnektor die Liste der Tabellen füllen, die für die Abfrage von Athena verfügbar sind.

Aktivieren des Spaltenabgleichs ohne Berücksichtigung der Groß-/Kleinschreibung

Um Spaltennamen aus Ihrer Neptune-Tabelle mit der richtigen Groß- und Kleinschreibung aufzulösen, auch wenn die Spaltennamen alle in Kleinbuchstaben geschrieben sind, können Sie den Neptune-Konnektor so konfigurieren AWS Glue, dass die Groß- und Kleinschreibung nicht berücksichtigt wird.

Um dieses Feature zu aktivieren, setzen Sie die Umgebungsvariable enable_caseinsensitivematch in der Lambda-Funktion des Neptune-Konnektors auf true.

Geben Sie den AWS Glue Glabel-Tabellenparameter für Tabellennamen in Groß-/Kleinschreibung an

Da nur Tabellennamen in Kleinbuchstaben AWS Glue unterstützt werden, ist es wichtig, den glabel AWS Glue Tabellenparameter anzugeben, wenn Sie eine AWS Glue Tabelle für Neptune erstellen und Ihr Neptune-Tabellenname Groß- und Kleinschreibung enthält.

Nehmen Sie den glabel Parameter in Ihre AWS Glue Tabellendefinition auf und setzen Sie seinen Wert auf Ihren Tabellennamen mit der ursprünglichen Groß-/Kleinschreibung. Dadurch wird sichergestellt, dass das richtige Gehäuse erhalten bleibt, wenn Sie mit Ihrem Neptune-Tisch AWS Glue interagieren. Im folgenden Beispiel wird der Wert von glabel auf den Tabellennamen Airport gesetzt.


glabel = Airport

Einstellung der glabel AWS Glue Tabelleneigenschaft, um die Groß- und Kleinschreibung des Tabellennamens für eine Neptun-Tabelle beizubehalten

Weitere Informationen zur Einrichtung eines für AWS Glue Data Catalog die Arbeit mit Neptune finden Sie unter AWS Glue Katalog einrichten auf GitHub .com.

Leistung

Der Athena-Neptune-Konnektor führt einen Prädikat-Pushdown durch, um die von der Abfrage durchsuchten Daten zu reduzieren. Prädikate, die den Primärschlüssel verwenden, führen jedoch zu einem Abfragefehler. LIMIT-Klauseln reduzieren die Menge der gescannten Daten, aber wenn Sie kein Prädikat angeben, sollten Sie davon ausgehen, dass SELECT-Abfragen mit einer LIMIT-Klausel mindestens 16 MB Daten scannen. Der Neptune-Konnektor ist aufgrund der Gleichzeitigkeit widerstandsfähig gegenüber Drosselung.

Pass-Through-Abfragen

Der Neptune-Connector unterstützt Pass-Through-Abfragen. Sie können diese Feature verwenden, um Gremlin-Abfragen für Eigenschaftsdiagramme und SPARQL-Abfragen für RDF-Daten auszuführen.

Um Pass-Through-Abfragen mit Neptune zu verwenden, verwenden Sie die folgende Syntax:


SELECT * FROM TABLE(
        system.query(
            DATABASE => 'database_name',
            COLLECTION => 'collection_name',
            QUERY => 'query_string'
        ))

Das folgende Beispiel für Neptune-Passthrough-Abfragen filtert nach Flughäfen mit dem Code ATL. Die doppelten einfachen Anführungszeichen stehen für Escape.


SELECT * FROM TABLE(
        system.query(
            DATABASE => 'graph-database',
            COLLECTION => 'airport',
            QUERY => 'g.V().has(''airport'', ''code'', ''ATL'').valueMap()' 
        ))

Weitere Ressourcen

Weitere Informationen zu diesem Connector finden Sie auf der entsprechenden Website auf GitHub .com.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

MySQL

OpenSearch