Conectores de fonte de dados disponíveis - Amazon Athena

Conectores de fonte de dados disponíveis

Esta seção lista os conectores de origem dos dados predefinidos do Athena que podem ser usados para consultar uma variedade de origens de dados externas ao Amazon S3. Para usar um conector em suas consultas do Athena, configure-o e implante-o em sua conta.

Considerações e limitações

  • Alguns conectores pré-construídos exigem que você crie uma VPC e um grupo de segurança antes de poder usar o conector. Para obter informações sobre como criar VPCs, consulte Criar uma VPC para um conector de fonte de dados ou conexão do AWS Glue (Criar uma VPC para um conector de origem de dados).

  • Para usar o recurso de consulta federada do Athena com o AWS Secrets Manager, configure um endpoint privado do Amazon VPC para o Secrets Manager. Para obter mais informações, consulte Criação de um endpoint privado da VPC para o Secrets Manager no Guia do usuário do AWS Secrets Manager.

  • Para conectores não compatíveis com passagem direta de predicados, as consultas que incluírem um predicado vão demorar mais para serem executadas. Para conjuntos de dados pequenos, muito poucos dados são examinados, e as consultas levam em média cerca de 2 minutos. No entanto, para grandes conjuntos de dados, muitas consultas podem expirar.

  • Algumas fontes de dados federadas usam terminologia para fazer referência a objetos de dados que são diferentes do Athena. Para obter mais informações, consulte Noções básicas de qualificadores de nomes de tabelas federadas.

  • Atualizamos nossos conectores periodicamente com base nas atualizações do banco de dados ou do provedor da fonte de dados. Não oferecemos suporte a fontes de dados que estejam em fim de vida útil.

  • Para conectores que não oferecem suporte à paginação ao listar tabelas, o serviço Web poderá atingir o tempo limite se o banco de dados tiver muitas tabelas e muitos metadados. Os seguintes conectores fornecem suporte à paginação para tabelas de listagem:

    • DocumentDB

    • DynamoDB

    • MySQL

    • OpenSearch

    • Oracle

    • PostgreSQL

    • Redshift

    • SQL Server

Modos de resolução de maiúsculas e minúsculas no SDK do Federation

O SDK do Federation é compatível com os seguintes modos padronizados de resolução de maiúsculas e minúsculas em nomes de esquemas e tabelas:

  • NONE: não altera maiúsculas e minúsculas nos nomes de esquemas e tabelas fornecidos.

  • LOWER: converte em minúsculas todos os nomes de esquemas e tabelas fornecidos.

  • UPPER: converte em maiúsculas todos os nomes de esquemas e tabela fornecidos.

  • ANNOTATION: esse modo é mantido apenas para compatibilidade com as versões anteriores e é compatível exclusivamente com os conectores do Snowflake e SAP HANA existentes.

  • CASE_INSENSITIVE_SEARCH: realiza pesquisas que não diferenciam maiúsculas de minúsculas em nomes de esquemas e tabelas.

Compatibilidade com conectores para modos de resolução de maiúsculas e minúsculas

Compatibilidade com o modo básico

Todos os conectores JDBC são compatíveis com os seguintes modos básicos:

  • NONE

  • LOWER

  • UPPER

Compatibilidade com o modo de anotação

Apenas os seguintes conectores são compatíveis com o modo ANNOTATION:

  • Snowflake

  • SAP HANA

nota

É recomendável usar CASE_INSENSITIVE_SEARCH em vez de ANNOTATION.

Compatibilidade com pesquisas que não diferenciam maiúsculas de minúsculas

Os seguintes conectores são compatíveis com CASE_INSENSITIVE_SEARCH:

  • DataLake Gen2

  • Snowflake

  • Oracle

  • Synapse

  • MySQL

  • PostgreSQL

  • Redshift

  • ClickHouse

  • SQL Server

  • DB2

Limitações da resolução de maiúsculas e minúsculas

Lembre-se das seguintes limitações ao usar modos de resolução de maiúsculas e minúsculas:

  • Ao usar o modo LOWER, o nome do esquema e todas as tabelas do esquema devem ser escritos em minúsculas.

  • Ao usar o modo UPPER, o nome do esquema e todas as tabelas do esquema devem ser escritos em maiúsculas.

  • Ao usar um CASE_INSENSITIVE_SEARCH:

    • Os nomes de esquemas devem ser exclusivos

    • Os nomes das tabelas de um esquema devem ser exclusivos (por exemplo, você não pode ter "Apple" e "APPLE")

  • Limitações da integração do Glue:

    • O Glue é compatível apenas com nomes em minúsculas

    • Somente os modos NONE ou LOWER funcionarão ao registrar a função do Lambda com o GlueDataCatalog/LakeFormation

Mais informações

nota

O AthenaJdbcConnector (versão mais recente 2022.4.1) foi descontinuado. Ao invés dele, use um conector específico para banco de dados como aqueles para MySQL, Redshift ou PostgreSQL.