Compilazione del catalogo AWS Glue dati

È possibile compilare il file AWS Glue Data Catalog utilizzando i seguenti metodi:

Crawler di AWS Glue — An Crawler di AWS Glue può scoprire e catalogare automaticamente fonti di dati come database, data lake e dati in streaming. I crawler sono il metodo più comune e consigliato per popolare il catalogo dati in quanto possono scoprire e dedurre automaticamente i metadati per un'ampia varietà di origini dati.
Aggiungere manualmente i metadati: puoi definire manualmente database, tabelle e dettagli di connessione e aggiungerli al Data Catalog utilizzando la AWS Glue console, la console Lake Formation o AWS Glue APIs. AWS CLI L'inserimento manuale è utile quando si desidera catalogare origini dati che non possono essere sottoposte a crawling.
Integrazione con altri AWS servizi: puoi popolare il Data Catalog con metadati di servizi come Amazon AWS Lake Formation Athena. Questi servizi possono scoprire e registrare origini dati nel catalogo dati.
Compilazione da un repository di metadati esistente: se disponi di un archivio di metadati esistente come Apache Hive Metastore, puoi utilizzarlo per importare tali metadati nel Data Catalog. AWS Glue Per ulteriori informazioni, consulta Migrazione tra Hive Metastore e on. AWS Glue Data Catalog GitHub

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Rilevamento e catalogazione dei dati

Usando un Crawler di AWS Glue