存取 Data Catalog
您可以使用 AWS Glue Data Catalog (Data Catalog) 來探索和了解您的資料。Data Catalog 提供一致的方法來維護結構描述定義、資料類型、位置及其他中繼資料。您可以使用下列方法來存取 Data Catalog:
AWS Glue 主控台 – 您可以透過以 Web 為基礎的使用者介面 AWS Glue 主控台,來存取和管理 Data Catalog。主控台可讓您瀏覽和搜尋資料庫、資料表及其關聯的中繼資料,以及建立、更新和刪除中繼資料定義。
AWS Glue 編目程式 – 編目程式是自動掃描資料來源並將中繼資料填入 Data Catalog 的程式。您可以建立和執行編目程式,從各種來源探索和歸類資料,例如 Amazon S3、Amazon RDS、Amazon DynamoDB、Amazon CloudWatch、與 JDBC 相容的關聯式資料庫 (例如 MySQL 和 PostgreSQL),以及數個非 AWS 來源 (例如 Snowflake 和 Google BigQuery)。
AWS Glue API – 您可以使用 AWS Glue API 以程式設計方式存取 Data Catalog。這些 API 可讓您以程式設計方式與 Data Catalog 互動,從而實現自動化並與其他應用程式和服務整合。
-
AWS Command Line Interface (AWS CLI) – 您可以使用 AWS CLI 從命令列存取和管理 Data Catalog。CLI 提供用於建立、更新和刪除中繼資料定義以及查詢和擷取中繼資料資訊的命令。
-
與其他 AWS 服務整合 – Data Catalog 與各種其他 AWS 服務整合,可讓您存取和利用儲存在型錄中的中繼資料。例如,您可以使用 Amazon Athena 透過 Data Catalog 中的中繼資料查詢資料來源,並使用 AWS Lake Formation 管理 Data Catalog 資源的資料存取和管控。