

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 連線至資料來源
<a name="work-with-data-stores"></a>

您可以使用 Amazon Athena 來查詢*資料集*中以不同位置和格式存放的資料。此資料集可能是 CSV，JSON，Avro、Parquet 或其他格式。

您在 Athena 中用來執行查詢的資料表和資料庫是以*中繼資料*為基礎。中繼資料是資料集中的基礎資料的相關資料。該中繼資料如何描述您的資料集，就稱為*結構描述*。例如，資料表名稱、資料表中的資料欄名稱及每一欄的資料類型都是結構描述 (儲存為中繼資料)，用於描述基礎資料集。在 Athena 中，用來組織中繼資料的系統稱為*資料目錄*或*中繼存放區*。資料集和描述它的資料目錄合稱為*資料來源*。

中繼資料與基礎資料集的關係取決於您使用的資料來源類型。關聯式資料來源 (例如 MySQL、PostgreSQL 和 SQL Server) 將中繼資料與資料集緊密整合。在這些系統中，中繼資料最常於寫入資料時寫入。其他資料來源 (例如使用 [Hive](https://hive.apache.org) 建置) 可讓您在讀取資料集時，即時定義中繼資料。資料集可以為多種格式，例如 CSV、JSON、Parquet 或 Avro。

Athena 原生支援 AWS Glue Data Catalog。 AWS Glue Data Catalog 是建置在其他資料集和資料來源上的資料目錄，例如 Amazon S3、Amazon Redshift 和 Amazon DynamoDB。您也可以使用各種連接器，將 Athena 連接至其他資料來源。

**Topics**
+ [使用 AWS Glue Data Catalog 連線到您的資料](data-sources-glue.md)
+ [使用 Amazon Athena 聯合查詢](federated-queries.md)
+ [在 Athena 中使用 Amazon DataZone](datazone-using.md)
+ [使用外部 Hive 中繼存放區](connect-to-data-source-hive.md)
+ [管理資料來源](data-sources-managing.md)