Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation de la requête fédérée Amazon Athena
Si vos données proviennent de sources autres qu'Amazon S3, vous pouvez utiliser Athena Federated Query pour interroger les données en place ou créer des pipelines qui extraient les données de plusieurs sources de données et les stockent dans Amazon S3. La requête fédérée d'Athena vous permet d'exécuter des requêtes SQL sur des données stockées dans des sources de données relationnelles, non relationnelles, objets et personnalisées. Pour obtenir la liste complète des sources de données prises en charge, consultez Connecteurs de source de données disponibles.
Lorsque vous exécutez une requête sur une source de données, Athena invoque le connecteur pour déterminer les données à lire, gère le parallélisme et envoie les prédicats de filtre vers le bas. Les connecteurs peuvent également restreindre l'accès aux données en fonction de l'utilisateur qui soumet la requête.
Athena utilise des connecteurs de source de données pour exécuter des requêtes fédérées sur les données sous-jacentes. Athena prend en charge deux types de connecteurs de source de données dotés de fonctionnalités différentes :
-
AWS Glue Data Catalog connecteurs fédérés : ces connecteurs utilisent une AWS Glue connexion pour se connecter à la source de données. Ils peuvent être utilisés avec un soutien précis au contrôle de la gouvernance des données via Lake Formation. Pour plus d'informations, consultez la section Connexions de données de catalogue fédérées dans le Guide du AWS Lake Formation développeur.
-
Les connecteurs associés à un Lambda peuvent éventuellement être enregistrés manuellement en tant que connecteurs AWS Glue Data Catalog à utiliser avec Lake Formation pour une gouvernance précise des données
-
À compter du 21 avril 2026, certains connecteurs nouvellement créés sont automatiquement enregistrés en tant que catalogues de données Glue et n'utilisent pas de fonction Lambda dans votre compte AWS
-
-
Connecteurs fédérés du catalogue de données Athena : ces connecteurs sont spécifiques à Athena et ne peuvent pas être enregistrés en tant que catalogues fédérés auprès de ceux-ci. AWS Glue Data Catalog Ils ont besoin d'une fonction Lambda dans votre AWS compte pour interroger les données. Les connecteurs personnalisés développés à l'aide du SDK Athena Query Federation sont des connecteurs de catalogue de données Athena. Pour de plus amples informations, veuillez consulter Développement d’un connecteur de source de données à l’aide du kit SDK Athena Query Federation.
Pour obtenir la liste des sources de données compatibles avec chaque type, consultezPrise en charge des types de connecteurs par source de données.
Note
Il est possible que des développeurs tiers aient utilisé le kit Athena Query Federation SDK pour écrire des connecteurs de sources de données. Pour tout problème de support ou de licence concernant ces connecteurs de sources de données, veuillez vous adresser à votre fournisseur de connecteurs. Ces connecteurs ne sont ni testés ni pris en charge par AWS.
Considérations et restrictions
-
Vues : vous pouvez désormais créer et interroger des vues sur des sources de données fédérées. Les vues fédérées sont stockées dans la source de données sous-jacente AWS Glue, et non dans celle-ci. Pour de plus amples informations, veuillez consulter Interrogation de vues fédérées.
-
Identificateurs délimités : les identificateurs délimités (aussi appelés identificateurs entre guillemets) commencent et se terminent par des guillemets doubles ("). À l’heure actuelle, les identificateurs délimités ne sont pas pris en charge dans le cadre des requêtes fédérées dans Athena.
-
Opérations d'écriture : les opérations d'écriture telles que INSERT INTO ne sont pas pris en charge. Si vous tentez de le faire, le message d'erreur suivant peut s'afficher :
This operation is currently not supported for external catalogs (Cette opération n'est actuellement pas prise en charge pour les catalogues externes). -
Tarification : pour des informations sur la tarification, consultez la rubrique Tarification Amazon Athena
. -
Pilote JDBC : pour utiliser le pilote JDBC avec des requêtes fédérées ou un métastore Hive externe, incluez
MetadataRetrievalMethod=ProxyAPIdans votre chaîne de connexion JDBC. Pour plus d'informations sur le pilote JDBC, voir Connexion à Amazon Athena avec JDBC. -
Secrets Manager : pour utiliser la fonction de requête fédérée d’Athena avec AWS Secrets Manager, vous devez configurer un point de terminaison privé Amazon VPC pour Secrets Manager. Pour plus d'informations, consultez la rubrique Création d'un point de terminaison privé VPC Secrets Manager du Guide de l'utilisateur AWS Secrets Manager .
-
Requêtes passthrough : les requêtes passthrough ne sont pas prises en charge une fois qu'une source de données est enregistrée en tant que. AWS Glue Data Catalog
Prise en charge des types de connecteurs par source de données
Le tableau suivant indique les types de connecteurs pris en charge par chaque source de données. Certains connecteurs de catalogue AWS Glue Data Catalog fédéré que vous créez le 21 avril 2026 ou après cette date ne nécessitent pas Lambda.
| Source de données | AWS Glue Data Catalog connecteurs fédérés | Connecteurs fédérés du catalogue de données Athena | |
|---|---|---|---|
| Sans Lambda | Avec Lambda | ||
| Amazon CloudWatch Logs | Oui | Oui | |
| CloudWatch Métriques Amazon | Oui | Oui | |
| Amazon DocumentDB | Oui | Oui | Oui |
| Amazon DynamoDB | Oui | Oui | Oui |
| Amazon MSK | Oui | ||
| Amazon Neptune | Oui | ||
| Amazon OpenSearch | Oui | Oui | Oui |
| Amazon Redshift | Oui | Oui | Oui |
| Amazon Timestream | Oui | Oui | |
| Stockage Azure Data Lake | Oui | Oui | |
| Azure Synapse | Oui | Oui | |
| Cloudera Hive | Oui | Oui | |
| Cloudera Impala | Oui | Oui | |
| CMDB | Oui | Oui | |
| Confluent | Oui | ||
| Personnalisé | Oui | ||
| DB2 | Oui | Oui | |
| Série Db2 i | Oui | Oui | |
| Google BigQuery | Oui | Oui | Oui |
| Stockage dans le cloud de Google | Oui | Oui | |
| HBase | Oui | Oui | |
| Hortonworks (Ruche) | Oui | ||
| Kafka | Oui | ||
| MySQL | Oui | Oui | Oui |
| Oracle | Oui | Oui | Oui |
| PostgreSQL | Oui | Oui | Oui |
| Système d'exploitation Redis | Oui | ||
| SAP HANA | Oui | Oui | Oui |
| Snowflake | Oui | Oui | Oui |
| SQL Server | Oui | Oui | Oui |
| Teradata | Oui | Oui | Oui |
| TPC-DS | Oui | Oui | |
| Vertica | Oui | Oui | |
Vidéos
Regardez les vidéos suivantes pour en savoir plus sur l'utilisation de la requête fédérée d’Athena.
Vidéo : Analyser les résultats d'une requête fédérée dans Amazon Athena dans Quick
La vidéo suivante montre comment analyser les résultats d'une requête fédérée Athena dans Quick.
Vidéo : Gaming Analytics Pipeline
La vidéo suivante montre comment déployer un pipeline de données (Data Pipeline) évolutif sans serveur pour intégrer, stocker et analyser des données de télémétrie provenant de jeux et de services à l'aide de requêtes fédérées Amazon Athena.