Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Compilazione del catalogo AWS Glue dati
È possibile compilare il file AWS Glue Data Catalog utilizzando i seguenti metodi:
-
Crawler di AWS Glue — An Crawler di AWS Glue può scoprire e catalogare automaticamente fonti di dati come database, data lake e dati in streaming. I crawler sono il metodo più comune e consigliato per popolare il catalogo dati in quanto possono scoprire e dedurre automaticamente i metadati per un'ampia varietà di origini dati.
-
Aggiungere manualmente i metadati: puoi definire manualmente database, tabelle e dettagli di connessione e aggiungerli al Data Catalog utilizzando la AWS Glue console, la console Lake Formation o AWS Glue APIs. AWS CLI L'inserimento manuale è utile quando si desidera catalogare origini dati che non possono essere sottoposte a crawling.
-
Integrazione con altri AWS servizi: puoi popolare il Data Catalog con metadati di servizi come Amazon AWS Lake Formation Athena. Questi servizi possono scoprire e registrare origini dati nel catalogo dati.
-
Compilazione da un repository di metadati esistente: se disponi di un archivio di metadati esistente come Apache Hive Metastore, puoi utilizzarlo per importare tali metadati nel Data Catalog. AWS Glue Per ulteriori informazioni, consulta Migrazione tra Hive Metastore e on. AWS Glue Data Catalog
GitHub