Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Développement de connecteurs personnalisés
Vous pouvez écrire le code qui lit ou écrit des données dans votre magasin de données et formate les données à utiliser avec les tâches AWS Glue Studio Glue Studio. Vous pouvez créer des connecteurs pour les magasins de données Spark, Athena et JDBC. L'exemple de code publié sur GitHub fournit un aperçu des interfaces de base que vous devez implémenter.
Vous aurez besoin d'un environnement de développement local pour créer votre code de connecteur. Vous pouvez utiliser n'importe quel IDE ou même simplement un éditeur de ligne de commande pour écrire votre connecteur. Voici quelques exemples d'environnements de développement :
-
Un environnement Scala local avec une bibliothèque AWS Glue ETL Maven locale, comme décrit dans Développement local avec Scala dans le Guide du développeur AWS Glue .
-
IntelliJ IDE, en téléchargeant l'IDE depuis. https://www.jetbrains.com/idea/
Rubriques
Développement de connecteurs Spark
Vous pouvez créer un connecteur Spark avec DataSource l'API Spark V2 (Spark 2.4) pour lire les données.
Pour créer un connecteur Spark personnalisé
Suivez les étapes de la bibliothèque AWS Glue GitHub d'exemples pour développer des connecteurs Spark, qui se trouve à l'adresse https://github.com/aws-samples/aws-glue-samples/tree/master/GlueCustomConnectors/development/Spark/README.md.
Développement de connecteurs Athena
Vous pouvez créer un connecteur Athena à utiliser par AWS Glue et AWS Glue Studio Glue Studio pour interroger une source de données personnalisée.
Pour créer un connecteur Athena personnalisé
Développement de connecteurs JDBC
Vous pouvez créer un connecteur qui utilise JDBC pour accéder à vos magasins de données.
Pour créer un connecteur JDBC personnalisé
-
Installez les bibliothèques d'exécution Spark AWS Glue dans votre environnement de développement local. Reportez-vous aux instructions de la bibliothèque AWS Glue GitHub d'exemples à l'adresse https://github.com/aws-samples/aws-glue-samples/tree/master/GlueCustomConnectors/development/GlueSparkRuntime/README.md.
-
Implémentez le pilote JDBC chargé de récupérer les données de la source de données. Reportez-vous à la documentation Java
pour Java SE 8. Créez un point d'entrée dans votre code qu'AWS Glue Studio Glue Studio utilise pour localiser votre connecteur. Le champ Class name (Nom de classe) doit être le chemin complet de votre pilote JDBC.
-
Utilisation de l'API
GlueContextpour lire les données avec le connecteur. Les utilisateurs peuvent ajouter plus d'options d'entrée dans la console AWS Glue Studio Glue Studio pour configurer la connexion à la source de données, si nécessaire. Pour un exemple de code qui montre comment lire et écrire dans une base de données JDBC avec un connecteur JDBC personnalisé, voir Valeurs personnalisées et ConnectionType. AWS Marketplace
Exemples d'utilisation de connecteurs personnalisés avec AWS Glue Studio Glue Studio
Vous pouvez consulter les blogs suivants pour des exemples d'utilisation de connecteurs personnalisés :
-
Apache Hudi : Écrire dans des tables Apache Hudi à l'aide du AWS Glue connecteur personnalisé
-
Google BigQuery : migration de données de Google vers Amazon S3 BigQuery à l'aide de connecteurs AWS Glue personnalisés
-
Snowflake (JDBC) : Exécution de transformations de données à l'aide de Snowflake et AWS Glue
-
SingleStore: Création d'un ETL rapide à l'aide SingleStore de et AWS Glue
Salesforce : ingérez des données Salesforce dans Amazon S3 à l'aide du connecteur personnalisé CData JDBC
avec - AWS Glue -
Amazon Relational Database Service (Amazon RDS) : création de tâches ETL AWS Glue Spark en apportant vos propres pilotes JDBC pour
Amazon RDS
Développement de AWS Glue connecteurs pour AWS Marketplace
En tant que AWS partenaire, vous pouvez créer des connecteurs personnalisés et les télécharger AWS Marketplace pour les vendre aux AWS Glue clients.
Le processus de développement du code du connecteur est le même que pour les connecteurs personnalisés, mais le processus de téléchargement et de vérification du code du connecteur est plus détaillé. Reportez-vous aux instructions de la section Création de connecteurs pour AWS Marketplace