可用資料來源連接器 - Amazon Athena

可用資料來源連接器

本節列出預先建置的 Athena 資料來源連接器,供您用來查詢 Simple Storage Service (Amazon S3) 外部的各種資料來源。若要在 Athena 查詢中使用連接器,請設定連接器並將其部署到您的帳戶。

考量與限制

  • 某些預先建置的連接器要求您先建立 VPC 和安全群組,然後才能使用連接器。如需建立 VPC 的相關資訊,請參閱 為資料來源連接器或 AWS Glue 連線建立 VPC

  • 若要將 Athena 聯合查詢功能搭配 AWS Secrets Manager,您必須為 Secrets Manager 設定 Amazon VPC 私有端點。如需詳細資訊,請參閱《AWS Secrets Manager 使用者指南》中的建立 Secrets Manager VPC 私有端點

  • 對於不支援述詞下推的連接器,包含述詞的查詢需要較長時間才能執行。對於小型資料集,只會掃描極少的資料,而查詢平均需要大約 2 分鐘。但是,對於大型資料集,許多查詢可能會逾時。

  • 有些聯合資料來源使用術語來描述與 Athena 不同的資料物件。如需更多詳細資訊,請參閱 了解聯合資料表名稱限定詞

  • 我們會根據資料庫或資料來源提供者的升級情況,定期更新連接器。我們不支援已終止支援的資料來源。

  • 針對列出資料表時不支援分頁的連接器,如果您的資料庫有許多資料表和中繼資料,Web 服務可能會逾時。下列連接器提供所列資料表的分頁支援:

    • DocumentDB

    • DynamoDB

    • MySQL

    • OpenSearch

    • Oracle

    • PostgreSQL

    • Redshift

    • SQL Server

Federation SDK 中的案例解析程式模式

Federation SDK 支援下列適用於結構描述和資料表名稱的標準化案例解析程式模式:

  • NONE – 請勿變更指定的結構描述和資料表名稱的大小寫。

  • LOWER – 將所有指定的結構描述和資料表名稱轉換為小寫。

  • UPPER – 將所有指定的結構描述和資料表名稱轉換為大寫。

  • ANNOTATION – 此模式僅為回溯相容性而保留,且僅由現有的 Snowflake 和 SAP HANA 連接器支援。

  • CASE_INSENSITIVE_SEARCH – 針對結構描述和資料表名稱執行不區分大小寫搜尋。

連接器支援案例解析程式模式

基本模式支援

所有 JDBC 連接器都支援下列基本模式:

  • NONE

  • LOWER

  • UPPER

註釋模式支援

只有下列連接器支援 ANNOTATION 模式:

  • Snowflake

  • SAP HANA

注意

建議使用 CASE_INSENSITIVE_SEARCH 而不是 ANNOTATION。

不區分大小寫搜尋支援

下列連接器支援 CASE_INSENSITIVE_SEARCH

  • DataLake Gen2

  • Snowflake

  • Oracle

  • Synapse

  • MySQL

  • PostgreSQL

  • Redshift

  • ClickHouse

  • SQL Server

  • DB2

案例解析程式限制

使用案例解析程式模式時,請注意下列限制:

  • 使用 LOWER 模式時,您的結構描述名稱和結構描述中的所有資料表必須是小寫。

  • 使用 UPPER 模式時,您的結構描述名稱和結構描述中的所有資料表必須是大寫。

  • 使用 CASE_INSENSITIVE_SEARCH 時:

    • 結構描述名稱必須是唯一的

    • 結構描述中的資料表名稱必須是唯一的 (例如,"Apple" 和 "APPLE" 不能同時存在)

  • Glue 整合限制:

    • Glue 僅支援小寫名稱

    • 使用 GlueDataCatalog/LakeFormation 註冊 Lambda 函式時,只有 NONELOWER 模式才會運作

其他資訊

注意

AthenaJdbcConnector (最新版本 2022.4.1) 已棄用。相反地,請使用資料庫特定連接器,例如適用於 MySQLRedshiftPostgreSQL 的連接器。