View a markdown version of this page

Utilisation de la requête fédérée Amazon Athena - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de la requête fédérée Amazon Athena

Si vos données proviennent de sources autres qu'Amazon S3, vous pouvez utiliser Athena Federated Query pour interroger les données en place ou créer des pipelines qui extraient les données de plusieurs sources de données et les stockent dans Amazon S3. La requête fédérée d'Athena vous permet d'exécuter des requêtes SQL sur des données stockées dans des sources de données relationnelles, non relationnelles, objets et personnalisées. Pour obtenir la liste complète des sources de données prises en charge, consultez Connecteurs de source de données disponibles.

Lorsque vous exécutez une requête sur une source de données, Athena invoque le connecteur pour déterminer les données à lire, gère le parallélisme et envoie les prédicats de filtre vers le bas. Les connecteurs peuvent également restreindre l'accès aux données en fonction de l'utilisateur qui soumet la requête.

Athena utilise des connecteurs de source de données pour exécuter des requêtes fédérées sur les données sous-jacentes. Athena prend en charge deux types de connecteurs de source de données dotés de fonctionnalités différentes :

  • AWS Glue Data Catalog connecteurs fédérés : ces connecteurs utilisent une AWS Glue connexion pour se connecter à la source de données. Ils peuvent être utilisés avec un soutien précis au contrôle de la gouvernance des données via Lake Formation. Pour plus d'informations, consultez la section Connexions de données de catalogue fédérées dans le Guide du AWS Lake Formation développeur.

    • Les connecteurs associés à un Lambda peuvent éventuellement être enregistrés manuellement en tant que connecteurs AWS Glue Data Catalog à utiliser avec Lake Formation pour une gouvernance précise des données

    • À compter du 21 avril 2026, certains connecteurs nouvellement créés sont automatiquement enregistrés en tant que catalogues de données Glue et n'utilisent pas de fonction Lambda dans votre compte AWS

  • Connecteurs fédérés du catalogue de données Athena : ces connecteurs sont spécifiques à Athena et ne peuvent pas être enregistrés en tant que catalogues fédérés auprès de ceux-ci. AWS Glue Data Catalog Ils ont besoin d'une fonction Lambda dans votre AWS compte pour interroger les données. Les connecteurs personnalisés développés à l'aide du SDK Athena Query Federation sont des connecteurs de catalogue de données Athena. Pour de plus amples informations, veuillez consulter Développement d’un connecteur de source de données à l’aide du kit SDK Athena Query Federation.

Pour obtenir la liste des sources de données compatibles avec chaque type, consultezPrise en charge des types de connecteurs par source de données.

Note

Il est possible que des développeurs tiers aient utilisé le kit Athena Query Federation SDK pour écrire des connecteurs de sources de données. Pour tout problème de support ou de licence concernant ces connecteurs de sources de données, veuillez vous adresser à votre fournisseur de connecteurs. Ces connecteurs ne sont ni testés ni pris en charge par AWS.

Considérations et restrictions

  • Vues : vous pouvez désormais créer et interroger des vues sur des sources de données fédérées. Les vues fédérées sont stockées dans la source de données sous-jacente AWS Glue, et non dans celle-ci. Pour de plus amples informations, veuillez consulter Interrogation de vues fédérées.

  • Identificateurs délimités : les identificateurs délimités (aussi appelés identificateurs entre guillemets) commencent et se terminent par des guillemets doubles ("). À l’heure actuelle, les identificateurs délimités ne sont pas pris en charge dans le cadre des requêtes fédérées dans Athena.

  • Opérations d'écriture : les opérations d'écriture telles que INSERT INTO ne sont pas pris en charge. Si vous tentez de le faire, le message d'erreur suivant peut s'afficher : This operation is currently not supported for external catalogs (Cette opération n'est actuellement pas prise en charge pour les catalogues externes).

  • Tarification : pour des informations sur la tarification, consultez la rubrique Tarification Amazon Athena.

  • Pilote JDBC : pour utiliser le pilote JDBC avec des requêtes fédérées ou un métastore Hive externe, incluez MetadataRetrievalMethod=ProxyAPI dans votre chaîne de connexion JDBC. Pour plus d'informations sur le pilote JDBC, voir Connexion à Amazon Athena avec JDBC.

  • Secrets Manager : pour utiliser la fonction de requête fédérée d’Athena avec AWS Secrets Manager, vous devez configurer un point de terminaison privé Amazon VPC pour Secrets Manager. Pour plus d'informations, consultez la rubrique Création d'un point de terminaison privé VPC Secrets Manager du Guide de l'utilisateur AWS Secrets Manager .

  • Requêtes passthrough : les requêtes passthrough ne sont pas prises en charge une fois qu'une source de données est enregistrée en tant que. AWS Glue Data Catalog

Prise en charge des types de connecteurs par source de données

Le tableau suivant indique les types de connecteurs pris en charge par chaque source de données. Certains connecteurs de catalogue AWS Glue Data Catalog fédéré que vous créez le 21 avril 2026 ou après cette date ne nécessitent pas Lambda.

Source de données AWS Glue Data Catalog connecteurs fédérés Connecteurs fédérés du catalogue de données Athena
Sans Lambda Avec Lambda
Amazon CloudWatch Logs Oui Oui
CloudWatch Métriques Amazon Oui Oui
Amazon DocumentDB Oui Oui Oui
Amazon DynamoDB Oui Oui Oui
Amazon MSK Oui
Amazon Neptune Oui
Amazon OpenSearch Oui Oui Oui
Amazon Redshift Oui Oui Oui
Amazon Timestream Oui Oui
Stockage Azure Data Lake Oui Oui
Azure Synapse Oui Oui
Cloudera Hive Oui Oui
Cloudera Impala Oui Oui
CMDB Oui Oui
Confluent Oui
Personnalisé Oui
DB2 Oui Oui
Série Db2 i Oui Oui
Google BigQuery Oui Oui Oui
Stockage dans le cloud de Google Oui Oui
HBase Oui Oui
Hortonworks (Ruche) Oui
Kafka Oui
MySQL Oui Oui Oui
Oracle Oui Oui Oui
PostgreSQL Oui Oui Oui
Système d'exploitation Redis Oui
SAP HANA Oui Oui Oui
Snowflake Oui Oui Oui
SQL Server Oui Oui Oui
Teradata Oui Oui Oui
TPC-DS Oui Oui
Vertica Oui Oui

Vidéos

Regardez les vidéos suivantes pour en savoir plus sur l'utilisation de la requête fédérée d’Athena.

Vidéo : Analyser les résultats d'une requête fédérée dans Amazon Athena dans Quick

La vidéo suivante montre comment analyser les résultats d'une requête fédérée Athena dans Quick.

Vidéo : Gaming Analytics Pipeline

La vidéo suivante montre comment déployer un pipeline de données (Data Pipeline) évolutif sans serveur pour intégrer, stocker et analyser des données de télémétrie provenant de jeux et de services à l'aide de requêtes fédérées Amazon Athena.