View a markdown version of this page

Uso de consulta federada de Amazon Athena - Amazon Athena

Uso de consulta federada de Amazon Athena

Si tiene datos en orígenes distintos de Amazon S3, puede utilizar la consulta federada de Athena para consultar los datos en el lugar o crear canalizaciones que extraen datos de varios orígenes de datos y almacenarlos en Amazon S3. Con la consulta federada de Athena, puede ejecutar consultas SQL en datos almacenados en orígenes de datos relaciones, no relacionales, personalizados y de objetos. Para obtener una lista completa de los orígenes de datos compatibles, consulte Conectores de orígenes de datos disponibles.

Cuando ejecuta una consulta en un origen de datos, Athena invoca el conector para determinar qué datos leer, administra el paralelismo y aplica la inserción de predicados de filtro. Los conectores también pueden restringir el acceso a los datos en función del usuario que envía la consulta.

Athena utiliza conectores de origen de datos para ejecutar consultas federadas en datos subyacentes. Athena admite dos tipos de conectores de orígenes de datos con diferentes capacidades:

  • Conectores federados de AWS Glue Data Catalog: estos conectores utilizan una conexión de AWS Glue para conectarse a el origen de datos. Se pueden usar con un soporte detallado de control de gobernanza de datos a través de Lake Formation. Para más información, consulte Conexiones del catálogo de datos federado en la Guía del programador de AWS Lake Formation.

    • Los conectores asociados a una Lambda se pueden registrar manualmente de forma opcional como un AWS Glue Data Catalog para usarlos con Lake Formation para una gobernanza de datos detallada

    • A partir del 21 de abril de 2026, algunos conectores recién creados se registran de manera automática como catálogos de datos de Glue y no utilizan una función de Lambda en su cuenta de AWS.

  • Conectores federados del catálogo de datos de Athena: estos conectores son específicos de Athena y no se pueden registrar como catálogos federados con AWS Glue Data Catalog. Es necesario tener una función de Lambda en su cuenta de AWS para consultar datos. Los conectores personalizados desarrollados con el SDK de federación de consultas de Athena son conectores del catálogo de datos de Athena. Para obtener más información, consulte Desarrollo de un conector de origen de datos mediante el SDK de Athena Query Federation.

Para obtener una lista de orígenes de datos compatibles con cada tipo, consulte Compatibilidad con el tipo de conector por origen de datos.

nota

Es posible que los desarrolladores de terceros hayan utilizado el SDK de Athena Query Federation para escribir conectores de origen de datos. Trabaje con su proveedor de conectores en caso de problemas de soporte o licencia con estos conectores de origen de datos. no prueba ni admite estos conectores AWS.

Consideraciones y limitaciones

  • Vistas: puede crear y consultar vistas en orígenes de datos federados. Las vistas federadas se almacenan en el AWS Glue, no en el origen de datos subyacente. Para obtener más información, consulte Consulta de vistas federadas.

  • Identificadores delimitados: los identificadores delimitados (también conocidos como identificadores entre comillas) comienzan y finalizan con comillas dobles ("). Actualmente, los identificadores delimitados no son compatibles con las consultas federadas en Athena.

  • Operaciones de escritura: las operaciones de escritura como INSERT INTO no son compatibles. Si se intenta hacerlo, puede aparecer el mensaje de error This operation is currently not supported for external catalogs (Esta operación no es compatible actualmente con catálogos externos).

  • Precios: para obtener información sobre precios, consulte Precios de Amazon Athena.

  • Controlador JDBC: para utilizar el controlador JDBC con consultas federadas o un metaalmacén externo de Hive, incluya MetadataRetrievalMethod=ProxyAPI en su cadena de conexión JDBC. Para obtener información acerca del controlador JDBC, consulte Conexión a Amazon Athena con JDBC.

  • Secrets Manager: para utilizar la característica de consulta federada de Athena con AWS Secrets Manager, debe configurar un punto de conexión privado de Amazon VPC para Secrets Manager. Para obtener más información, consulte Creación de un punto de conexión privado de VPC de Secrets Manager en la Guía del usuario de AWS Secrets Manager.

  • Consultas de acceso directo: las consultas de acceso directo no se admiten después de registrar un origen de datos como un AWS Glue Data Catalog.

Compatibilidad con el tipo de conector por origen de datos

En la siguiente tabla, se muestran los tipos de conectores que admite cada origen de datos. Algunos conectores de catálogo federados de AWS Glue Data Catalog que cree a partir del 21 de abril de 2026 no requieren Lambda.

Origen de datos Conectores federados de AWS Glue Data Catalog Conectores federados del catálogo de datos de Athena
Sin Lambda Con Lambda
Registros de Amazon CloudWatch
Métricas de Amazon CloudWatch
Amazon DocumentDB
Amazon DynamoDB
Amazon MSK
Amazon Neptune
Amazon OpenSearch
Amazon Redshift
Amazon Timestream
Azure Data Lake Storage
Azure Synapse
Cloudera Hive
Cloudera Impala
CMDB
Confluent
Personalizada
Db2
Db2 iSeries
Google BigQuery
Google Cloud Storage
HBase
Hortonworks (Hive)
Kafka
MySQL
Oracle
PostgreSQL
Redis OSS
SAP HANA
Snowflake
de SQL Server
Teradata
TPC-DS
Vertica

Videos

Vea los siguientes videos para obtener más información sobre el uso de la consulta federada de Athena.

Video: Analyze Results of Federated Query in Amazon Athena in Quick

En el siguiente video, se muestra cómo analizar los resultados de una consulta federada de Athena en Quick.

Video: Canalización de análisis de juegos

En el siguiente video, se muestra cómo implementar una canalización de datos escalable sin servidor para capturar, almacenar y analizar datos de telemetría de juegos y servicios mediante consultas federadas de Amazon Athena.