Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Connessione ai dati
Una connessione di AWS Glue è un oggetto del Catalogo dati che memorizza le credenziali di accesso, le stringhe URI, le informazioni relative al cloud privato virtuale (VPC) e altri dati per uno specifico archivio dati. I crawler, i processi e gli endpoint di sviluppo di AWS Glue usano le connessioni per accedere a determinati tipi di archivi dati. È possibile utilizzare le connessioni sia per le origini che per le destinazioni e riutilizzare la stessa connessione su più crawler o più processi di estrazione, trasformazione e caricamento (ETL).
L'ultima versione dello schema delle connessioni AWS Glue offre un modo unificato per gestire le connessioni dati tra servizi AWS e applicazioni come Unified Studio AWS Glue, Amazon Athena e Amazon SageMaker AI.
Panoramica sull'utilizzo di connettori e connessioni
Una connessione contiene le proprietà necessarie per connettersi a un particolare datastore. Quando crei una connessione, questa viene archiviata in AWS Glue Data Catalog. Scegli un connettore e quindi crea una connessione basata su di esso.
Puoi sottoscrivere i connettori per gli archivi dati non supportati in modo nativo in Marketplace AWS e quindi utilizzare tali connettori durante la creazione di connessioni. Gli sviluppatori possono anche creare i propri connettori ed è possibile utilizzarli durante la creazione di connessioni.
Nota
Le connessioni create utilizzando connettori personalizzati o Marketplace AWS in AWS Glue Studio vengono visualizzati nella console AWS Glue con tipo impostato su UNKNOWN.
La procedura riportata di seguito illustra il processo generale di utilizzo dei connettori in AWS Glue Studio:
-
Sottoscrivi un connettore in Marketplace AWS o sviluppa il tuo connettore e caricalo su AWS Glue Studio. Per ulteriori informazioni, consulta Aggiunta di connettori a AWS Glue Studio.
-
Esamina le informazioni sull'utilizzo del connettore. Puoi trovare queste informazioni nella scheda Usage (Utilizzo) nella pagina prodotto del connettore. Ad esempio, facendo clic sulla scheda Usage (Utilizzo) in questa pagina prodotto, AWS Glue Connector for Google BigQuery
(Connettore per Google BigQuery di ), nella sezione Additional Resources (Risorse aggiuntive) è possibile visualizzare un collegamento a un blog sull'utilizzo di questo connettore. -
Crea una connessione. Puoi scegliere quale connettore utilizzare e fornire informazioni aggiuntive per la connessione, ad esempio le credenziali di accesso, le stringhe URI e le informazioni sul cloud privato virtuale (VPC). Per ulteriori informazioni, consulta Creazione di connessioni per i connettori.
-
Creare un ruolo IAM per il processo. Il processo assume le autorizzazioni del ruolo IAM specificate al momento della creazione. Questo ruolo IAM deve avere le autorizzazioni necessarie per autenticare, estrarre e scrivere dati nei datastore.
-
Crea un processo ETL e configura le proprietà dell'origine dati per il processo ETL. Fornire le opzioni di connessione e le informazioni di autenticazione secondo le istruzioni fornite dal provider di connettori personalizzati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.
-
Personalizza il processo ETL aggiungendo trasformazioni o datastore aggiuntivi, come descritto in Avvio di processi ETL visivi in AWS Glue Studio.
-
Se usi un connettore per la destinazione dati, configura le proprietà della destinazione dati per il processo ETL. Fornire le opzioni di connessione e le informazioni di autenticazione secondo le istruzioni fornite dal provider di connettori personalizzati. Per ulteriori informazioni, consulta Creazione di processi con connettori personalizzati.
-
Personalizza l'ambiente di esecuzione configurando le proprietà del processo, come descritto in Modificare le proprietà del processo.
-
Esegui il processo.