View a markdown version of this page

Usar a consulta federada do Amazon Athena - Amazon Athena

Usar a consulta federada do Amazon Athena

Se você tiver dados em fontes diferentes do Amazon S3, poderá usar a consulta federada do Athena para consultá-los no local ou criar pipelines para extrair os dados de várias fontes de dados e armazená-los no Amazon S3. Com a consulta federada do Athena, é possível executar consultas SQL nos dados armazenados em origens relacionais, não relacionais, de objetos e personalizadas. Para obter uma lista completa das fontes de dados suportadas, consulte Conectores de fonte de dados disponíveis.

Quando uma consulta é realizada em uma fonte de dados, o Athena invoca o conector para determinar quais dados serão lidos, gerencia o paralelismo e envia os predicados de filtro. Os conectores também podem restringir o acesso aos dados com base no usuário que envia a consulta.

O Athena usa conectores de fonte de dados para executar as consultas federadas nos dados subjacentes. O Athena é compatível com dois tipos de conectores de fonte de dados com recursos diferentes:

  • Conectores federados do AWS Glue Data Catalog – Esses conectores usam uma conexão do AWS Glue para se conectar à fonte de dados. Eles podem ser usados com suporte ao controle refinado de governança de dados por meio do Lake Formation. Para obter mais informações, consulte Conexões de dados do catálogo federado no Guia do desenvolvedor do AWS Lake Formation.

    • Os conectores associados a um Lambda podem, opcionalmente, ser registrados manualmente como um AWS Glue Data Catalog para serem usados com o Lake Formation para proporcionar uma governança de dados refinada.

    • Desde 21 de abril de 2026, alguns conectores recém-criados são registrados automaticamente como catálogos de dados do Glue e não usam uma função do Lambda em sua conta da AWS.

  • Conectores federados do catálogo de dados do Athena – Esses conectores são específicos do Athena e não podem ser registrados como catálogos federados com AWS Glue Data Catalog. Eles exigem uma função do Lambda na sua conta da AWS. Os conectores personalizados desenvolvidos com o uso do SDK de federação de consultas do Athena são conectores do catálogo de dados do Athena. Para obter mais informações, consulte Desenvolver um conector de fonte de dados com uso do SDK do Athena Query Federation.

Para obter uma lista de fontes de dados compatíveis com cada tipo, consulte Suporte ao tipo de conector por fonte de dados.

nota

Desenvolvedores de terceiro podem ter usado o Athena Query Federation SDK para escrever conectores de origem dos dados. Para problemas de suporte ou licenciamento com esses conectores de origem dos dados, entre em contato com o provedor dos conectores. Esses conectores não foram testados nem contam com suporte da AWS.

Considerações e limitações

  • Visualizações: é possível criar e consultar visualizações em fontes de dados federadas. As visualizações federadas são armazenadas no AWS Glue, não na fonte de dados subjacente. Para obter mais informações, consulte Consultar visualizações federadas.

  • Identificadores delimitados: os identificadores delimitados (também conhecidos como identificadores citados) começam e terminam com aspas ("). Atualmente, não há compatibilidade com identificadores delimitados para consultas federadas no Athena.

  • Operações de gravação: operações de gravação como INSERT INTO não são suportadas. Tentar fazer isso pode gerar a mensagem de erro: This operation is currently not supported for external catalogs (Atualmente, esta operação não é suportada para catálogos externos).

  • Preço: para obter informações de preço, consulte Preços do Amazon Athena.

  • Driver JDBC: para usar o driver JDBC com consultas federadas ou um metastore externo do Hive, inclua MetadataRetrievalMethod=ProxyAPI na string de conexão JDBC. Para obter informações sobre o driver JDBC, consulte Conectar ao Amazon Athena com JDBC.

  • Secrets Manager: para usar o recurso de consulta federada do Athena com AWS Secrets Manager, você deve configurar um endpoint privado do Amazon VPC para o Secrets Manager. Para obter mais informações, consulte Criação de um endpoint privado da VPC para o Secrets Manager no Guia do usuário do AWS Secrets Manager.

  • Consultas de passagem – As consultas de passagem não são suportadas depois que uma fonte de dados é registrada como AWS Glue Data Catalog.

Suporte ao tipo de conector por fonte de dados

A tabela a seguir mostra os tipos de conectores que cada fonte de dados suporta. Alguns conectores do catálogo federado do AWS Glue Data Catalog criados a partir de 21 de abril de 2026 não exigem o Lambda.

Fonte de dados Conectores federados do AWS Glue Data Catalog Conectores federados do catálogo de dados do Athena
Sem Lambda Com Lambda
Amazon CloudWatch Logs Sim Sim
Métricas do Amazon CloudWatch Sim Sim
Amazon DocumentDB Sim Sim Sim
Amazon DynamoDB Sim Sim Sim
Amazon MSK Sim
Amazon Neptune Sim
Amazon OpenSearch Sim Sim Sim
Amazon Redshift Sim Sim Sim
Amazon Timestream Sim Sim
Azure Data Lake Storage Sim Sim
Azure Synapse Sim Sim
Cloudera Hive Sim Sim
Cloudera Impala Sim Sim
CMDB Sim Sim
Confluent Sim
Personalizada Sim
Db2 Sim Sim
Db2 iSeries Sim Sim
Google BigQuery Sim Sim Sim
Google Cloud Storage Sim Sim
HBase Sim Sim
Hortonworks (Hive) Sim
Kafka Sim
MySQL Sim Sim Sim
Oracle Sim Sim Sim
PostgreSQL Sim Sim Sim
Redis OSS Sim
SAP HANA Sim Sim Sim
Snowflake Sim Sim Sim
do SQL Server Sim Sim Sim
Teradata Sim Sim Sim
TPC-DS Sim Sim
Vertica Sim Sim

Vídeos

Assista aos vídeos a seguir para saber mais como usar a consulta federada do Athena.

Vídeo: analisar os resultados da consulta federada do Amazon Athena no Quick

O vídeo a seguir demonstra como analisar os resultados de uma consulta federada do Athena no Quick.

Vídeo: Game Analytics Pipeline

O vídeo a seguir mostra como implantar um pipeline de dados escalável sem servidor para ingerir, armazenar e analisar dados de telemetria de jogos e serviços usando as consultas federadas do Amazon Athena.