Utilizzo di connettori e connessioni personalizzati con AWS Glue Studio - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di connettori e connessioni personalizzati con AWS Glue Studio

AWS Glue fornisce supporto integrato per gli archivi dati più comuni (ad esempio Amazon Redshift, Amazon Aurora, Microsoft SQL Server, MySQL, MongoDB e PostgreSQL) utilizzando le connessioni JDBC. AWS Glue consente inoltre di usare driver JDBC personalizzati nei processi di estrazione, trasformazione e caricamento (ETL). Per gli archivi dati non supportati in modo nativo, ad esempio le applicazioni SaaS, è possibile utilizzare i connettori.

Un connettore è un pacchetto di codice opzionale che aiuta con l'accesso ai datastore in AWS Glue Studio. Puoi iscriverti a diversi connettori offerti in Marketplace AWS.

Durante la creazione di processi ETL, puoi utilizzare un datastore supportato nativamente, un connettore da Marketplace AWS o i tuoi connettori personalizzati. Se utilizzi un connettore, è innanzitutto necessario creare una connessione. Una connessione contiene le proprietà necessarie per connettersi a un particolare datastore. È possibile utilizzare la connessione con le tue origini dati e destinazioni dati nel processo ETL. Connettori e connessioni funzionano insieme per facilitare l'accesso ai datastore.

Le seguenti connessioni sono disponibili durante la creazione di connessioni per connettori:

  • Amazon Aurora— un motore di database relazionale scalabile e ad alte prestazioni con sicurezza, backup e ripristino integrati e accelerazione in memoria.

  • Amazon DocumentDB: un servizio di database di documenti scalabile, altamente disponibile e completamente gestito, che supporta le API MongoDB e SQL.

  • Amazon Redshift: un servizio di database di documenti scalabile, altamente disponibile e completamente gestito, che supporta le API MongoDB e SQL.

  • Azure SQL: un servizio di database relazionale basato su cloud di Microsoft Azure che offre funzionalità di archiviazione e gestione dei dati scalabili, affidabili e sicure.

  • Cosmos DB: un servizio di database cloud distribuito a livello globale di Microsoft Azure che offre funzionalità di archiviazione e interrogazione di dati scalabili e ad alte prestazioni.

  • Google BigQuery: un data warehouse cloud serverless per l'esecuzione di query SQL veloci su set di dati di grandi dimensioni.

  • JDBC: un sistema di gestione di database relazionale (RDBMS) che utilizza un'API Java per connettersi e interagire con le connessioni dati.

  • Kafka: una piattaforma di elaborazione di flussi open-source, utilizzata per lo streaming e la messaggistica di dati in tempo reale.

  • MariaDB: un fork di MySQL sviluppato dalla comunità che offre prestazioni, scalabilità e funzionalità migliorate.

  • MongoDB: un database orientato ai documenti multipiattaforma che offre scalabilità, flessibilità e prestazioni elevate.

  • MongoDB Atlas: un'offerta di database as a service (DBaaS) basata su cloud di MongoDB che semplifica la gestione e la scalabilità delle implementazioni di MongoDB.

  • Microsoft SQL Server: un sistema di gestione di database relazionale (RDBMS) di Microsoft che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • Mixpanel: una piattaforma di analisi che aiuta le aziende ad analizzare il modo in cui gli utenti interagiscono con i loro siti Web, con le loro applicazioni mobili e con altri prodotti digitali.

  • MySQL: un sistema di gestione di database relazionale (RDBMS) open-source ampiamente utilizzato nelle applicazioni Web e noto per la sua affidabilità e scalabilità.

  • Rete: un'origine dati di rete rappresenta una risorsa o un servizio accessibile in rete a cui è possibile accedere tramite una piattaforma di integrazione dei dati.

  • OpenSearch: un'origine dati OpenSearch è un'applicazione a cui OpenSearch può connettersi e da cui può importare dati.

  • Oracle: un sistema di gestione di database relazionale (RDBMS) di Oracle Corporation che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • PostgreSQL: un sistema di gestione di database relazionale (RDBMS) open-source che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • Salesforce: Salesforce fornisce software di gestione delle relazioni con i clienti (CRM) che aiutano nelle vendite, nell'assistenza clienti, nell'e-commerce e altro ancora. Se sei un utente Salesforce, puoi collegare AWS Glue al tuo account Salesforce. Quindi, puoi usare Salesforce come origine o destinazione dei dati per i tuoi processi ETL. Esegui questi processi per trasferire dati tra Salesforce e i servizi AWS o altre applicazioni supportate.

  • SAP HANA: un database in memoria e una piattaforma di analisi che fornisce elaborazione rapida dei dati, analisi avanzate e integrazione dei dati in tempo reale.

  • Snowflake: un data warehouse basato su cloud che fornisce servizi di archiviazione e analisi dei dati scalabili e ad alte prestazioni.

  • Teradata: un sistema di gestione di database relazionale (RDBMS) che offre funzionalità di archiviazione, analisi e reporting dei dati ad alte prestazioni.

  • Vertica: un data warehouse analitico orientato alle colonne progettato per l'analisi di big data che offre prestazioni di query rapide, analisi avanzate e scalabilità.