填入 AWS Glue Data Catalog - AWS Glue

填入 AWS Glue Data Catalog

可以使用以下方法來填入 AWS Glue Data Catalog:

  • AWS Glue 編目程式 – AWS Glue 編目程式 可以自動發現和分類資料來源,例如資料庫、資料湖和串流資料。編目程式是填入 Data Catalog 的最常見建議方法,因為其可以自動發現和推斷各種資料來源的中繼資料。

  • 手動新增中繼資料 – 可以使用 AWS Glue 主控台、Lake Formation 主控台、AWS CLI 或 AWS Glue API,手動定義資料庫、資料表和連線詳細資訊,並將其新增至 Data Catalog。當您想要針對無法編目的資料來源編製型錄時,手動輸入非常有用。

  • 與其他 AWS 服務整合 – 可以使用 AWS Lake Formation 和 Amazon Athena 等服務的中繼資料填入 Data Catalog。這些服務可以在 Data Catalog 中發現和註冊資料來源。

  • 從現有的中繼資料儲存庫填入 - 如果您有現有的中繼資料存放區,例如 Apache Hive Metastore,則可以使用 AWS Glue 將該中繼資料匯入 Data Catalog。如需詳細資訊,請參閱 GitHub 上的 Migration between the Hive Metastore and the AWS Glue Data Catalog