可用数据来源连接器 - Amazon Athena

可用数据来源连接器

本节列出了可用于查询 Amazon S3 外部的各种数据来源的预构建 Athena 数据来源连接器。要在 Athena 查询中使用连接器,请对其进行配置并部署到您的账户。

注意事项和限制

  • 一些预构建连接器需要您先创建 VPC 和安全组,才能使用该连接器。有关创建 VPC 的信息,请参阅 为数据来源连接器或 AWS Glue 连接创建 VPC

  • 若要将 Athena Federated Query 功能与 AWS Secrets Manager 结合使用,您必须为 Secrets Manager 配置 Amazon VPC 私有端点。有关更多信息,请参阅《AWS Secrets Manager 用户指南》中的 创建 Secrets Manager VPC 私有端点

  • 对于不支持谓词下推的连接器,执行包含谓词的查询花费的时间会更长。对于小型数据集,扫描的数据很少,因而查询平均需要大约 2 分钟。但是,对于大型数据集,许多查询可能会超时。

  • 一些联合数据来源使用术语来指代与 Athena 不同的数据对象。有关更多信息,请参阅 了解联合表名限定词

  • 根据数据库或数据来源提供商的升级,我们会定期更新连接器。我们不支持生命周期已结束的数据来源。

  • 对于在您列出表时不支持分页的连接器,如果您的数据库中有许多表和元数据,Web 服务可能会超时。以下连接器为列出表提供分页支持:

    • DocumentDB

    • DynamoDB

    • MySQL

    • OpenSearch

    • Oracle

    • PostgreSQL

    • Redshift

    • SQL Server

Federation SDK 中的大小写解析器模式

Federation SDK 支持架构和表名的以下标准化大小写解析器模式:

  • NONE:不更改给定架构和表名的大小写。

  • LOWER:所有给定的架构和表名全部小写。

  • UPPER:所有给定的架构和表名全部大写。

  • ANNOTATION:此模式仅为向后兼容而保留,并且仅由现有的 Snowflake 和 SAP HANA 连接器支持。

  • CASE_INSENSITIVE_SEARCH:对架构和表名执行不区分大小写的搜索。

支持大小写解析器模式的连接器

基本模式支持

所有 JDBC 连接器都支持以下基本模式:

  • NONE

  • LOWER

  • UPPER

注释模式支持

只有以下连接器支持 ANNOTATION 模式:

  • Snowflake

  • SAP HANA

注意

建议使用 CASE_INSENSITIVE_SEARCH 而不是 ANNOTATION。

不区分大小写的搜索支持

以下连接器支持 CASE_INSENSITIVE_SEARCH

  • DataLake Gen2

  • Snowflake

  • Oracle

  • Synapse

  • MySQL

  • PostgreSQL

  • Redshift

  • ClickHouse

  • SQL Server

  • DB2

大小写解析器限制

使用大小写解析器模式时,请注意以下限制:

  • 使用 LOWER 模式时,架构名称和架构中所有表都必须为小写。

  • 使用 UPPER 模式时,架构名称和架构中所有表都必须为大写。

  • 使用 CASE_INSENSITIVE_SEARCH 时:

    • 架构名称必须唯一

    • 架构中的表名必须唯一(例如,不能同时使用“Apple”和“APPLE”)

  • Glue 集成限制:

    • Glue 仅支持小写名称

    • 向 GlueDataCatalog/LakeFormation 注册 Lambda 函数时,仅支持 NONELOWER 模式

其他信息

注意

AthenaJdbcConnector(最新版本 2022.4.1)已弃用。请改用特定于数据库的连接器,例如 MySQLRedshiftPostgreSQL 的连接器。