Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Herstellen einer Verbindung zu Daten
Eine AWS Glue-Verbindung ist ein Data-Catalog-Objekt, in dem Anmeldeinformationen, URI-Zeichenfolgen, Informationen zu Virtual Private Cloud (VPC) und mehr für einen bestimmten Datenspeicher gespeichert werden. AWS Glue-Crawler, Aufträge und Entwicklungsendpunkte verwenden Verbindungen, um auf bestimmte Arten von Datenspeichern zuzugreifen. Sie können Verbindungen sowohl für Quellen als auch für Ziele verwenden und dieselbe Verbindung für mehrere Crawler- oder ETL-Aufträge (Extract, Transform, Load) verwenden.
Die aktuelle Version des AWS Glue-Verbindungsschemas bietet eine einheitliche Möglichkeit, Datenverbindungen zwischen AWS-Services und Anwendungen wie AWS Glue, Amazon Athena, und Amazon SageMaker AI Unified Studio zu verwalten.
Übersicht zur Verwendung von Connectors und Verbindungen
Eine Verbindung enthält die Eigenschaften, die für das Verbinden mit einem bestimmten Datenspeicher erforderlich sind. Wenn Sie eine Verbindung erstellen, wird sie im AWS Glue Data Catalog gespeichert. Sie wählen einen Connector aus und erstellen dann eine Verbindung basierend auf diesem Connector.
Sie können Connectors für nicht nativ unterstützte Datenspeicher in AWS Marketplace abonnieren und Erstellen von Verbindungen verwenden. Entwickler können auch eigene Connectors erstellen und sie beim Erstellen von Verbindungen verwenden.
Anmerkung
Verbindungen, die mit benutzerdefinierten oder AWS Marketplace-Connectors in AWS Glue Studio erstellt werden, werden in der AWS Glue-Konsole mit dem Typ UNKNOWN angezeigt.
In den folgenden Schritten wird der allgemeine Prozess zur Verwendung von Connectors in AWS Glue Studio beschrieben:
-
Abonnieren Sie einen Connector in AWS Marketplace oder entwickeln Sie Ihren eigenen Connector und laden Sie ihn in AWS Glue Studio hoch. Weitere Informationen finden Sie unter Hinzufügen von Connectors zu AWS Glue Studio.
-
Überprüfen Sie die Nutzungsinformationen des Connectors. Sie finden diese Informationen auf der Registerkarte Usage (Verwendung) auf der Produktseite des Connectors. Wenn Sie zum Beispiel auf die Registerkarte Usage (Verwendung) auf dieser Produktseite, AWS Glue Connector für Google BigQuery
, klicken, finden Sie im Bereich Additional Ressource (Weitere Ressourcen) einen Link zu einem Blog über die Verwendung dieses Connectors. -
Verbindung erstellen Sie wählen den Connector aus, den Sie verwenden möchten, und stellen zusätzliche Informationen für die Verbindung bereit, wie Anmeldeinformationen, URI-Zeichenfolgen und VPC-Informationen (Virtual Private Cloud). Weitere Informationen finden Sie unter Erstellen von Verbindungen für Connectors.
-
Erstellen Sie eine IAM-Rolle für Ihren Auftrag. Der Auftrag übernimmt die Berechtigungen der IAM-Rolle, die Sie angeben, wenn Sie sie erstellen. Diese IAM-Rolle muss über die nötigen Berechtigungen verfügen, sich bei Ihren Datenspeichern zu authentifizieren, Daten daraus zu extrahieren und darin zu schreiben.
-
Erstellen Sie einen ETL-Auftrag und konfigurieren Sie die Datenquelleneigenschaften für Ihren ETL-Auftrag. Geben Sie die Verbindungsoptionen und Authentifizierungsinformationen an, wie vom benutzerdefinierten Connector-Anbieter angewiesen. Weitere Informationen finden Sie unter Erstellen von Aufgaben mit benutzerdefinierten Konnektoren.
-
Passen Sie Ihren ETL-Auftrag an, indem Sie Transformationen oder zusätzliche Datenspeicher hinzufügen, wie unter Starten von Visual-ETL-Aufträgen in AWS Glue Studio beschrieben.
-
Wenn Sie einen Connector für das Datenziel verwenden, konfigurieren Sie die Datenzieleigenschaften für Ihren ETL-Auftrag. Geben Sie die Verbindungsoptionen und Authentifizierungsinformationen an, wie vom benutzerdefinierten Connector-Anbieter angewiesen. Weitere Informationen finden Sie unter Erstellen von Aufgaben mit benutzerdefinierten Konnektoren.
-
Passen Sie die Umgebung der Auftragsausführung an, indem Sie Auftragseigenschaften konfigurieren, wie unter Ändern der Auftragseigenschaften beschrieben.
-
Führen Sie den Auftrag aus.