本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 AWS Glue Data Catalog 連線到您的資料
Athena 使用 AWS Glue Data Catalog 來存放儲存在 Amazon S3 中資料的中繼資料,例如資料表和資料欄名稱。此中繼資料資訊會成為您在 Athena 查詢編輯器中看到的資料庫、資料表和檢視。
搭配 使用 Athena 時 AWS Glue Data Catalog,您可以使用 AWS Glue 來建立要在 Athena 中查詢的資料庫和資料表 (結構描述),也可以使用 Athena 來建立結構描述,然後在 AWS Glue 和相關服務中使用它們。
若要定義 的結構描述資訊 AWS Glue,您可以在 Athena 主控台中使用表單、在 Athena 中使用查詢編輯器,或在 AWS Glue console 中建立 AWS Glue 爬蟲程式。 AWS Glue 爬蟲程式會自動從 Amazon S3 中的資料推斷資料庫和資料表結構描述。使用表單可提供更多自訂功能。撰寫您自己的CREATE TABLE
陳述式需要更多努力,但提供最多的控制。如需詳細資訊,請參閱CREATE TABLE。
其他資源
-
如需 的詳細資訊 AWS Glue Data Catalog,請參閱《 AWS Glue 開發人員指南》中的 中的資料目錄和爬蟲程式 AWS Glue。
-
如需示範如何使用 AWS Glue 和 Athena 處理 XML 資料的說明性文章,請參閱 AWS 大數據部落格中的使用 和 Amazon Athena 處理和分析高度巢狀 AWS Glue 和大型 XML 檔案
。 -
需支付個別費用 AWS Glue。如需詳細資訊,請參閱 AWS Glue 定價
。