Utilisation du AWS Glue Data Catalog pour la connexion à vos données
Athena utilise le AWS Glue Data Catalog pour stocker les métadonnées telles que les noms de table et de colonne pour vos données stockées dans Amazon S3. Ces métadonnées constituent ensuite les bases de données, les tables et les vues que vous visualisez dans l’éditeur de requête Athena.
Lorsque vous utilisez Athena avec AWS Glue Data Catalog, vous pouvez utiliser AWS Glue pour créer des bases de données et des tables (schéma) à interroger dans Athena, ou vous pouvez utiliser Athena pour créer un schéma, puis l'utiliser dans AWS Glue et les services connexes.
Pour définir des informations de schéma pour AWS Glue, vous pouvez utiliser un formulaire de la console Athena ou l’éditeur de requête Athena ou créer un robot AWS Glue dans la console AWS Glue. Les robots AWS Glue infèrent automatiquement le schéma de base de données et de table de vos données dans Amazon S3. L’utilisation d’un formulaire offre davantage de possibilités de personnalisation. L’écriture de vos propres instructions CREATE TABLE nécessitera plus d’efforts, mais elle vous assurera un plus grand contrôle. Pour de plus amples informations, consultez CREATE TABLE.
Ressources supplémentaires
-
Pour plus d'informations sur le AWS Glue Data Catalog, voir la rubrique Catalogue de données et crawlers dans AWS Glue du Guide du développeur AWS Glue.
-
Pour découvrir comment utiliser AWS Glue et Athena pour traiter les données XML, consultez l’article Process and analyze highly nested and large XML files using AWS Glue and Amazon Athena
sur le blog AWS Big Data Blog. -
Des frais distincts s'appliquent à AWS Glue. Pour plus d’informations, consultez Tarification d’AWS Glue
.
Rubriques
Enregistrement et utilisation des catalogues de données dans Athena
Enregistrement d’un catalogue de données à partir d’un autre compte
Contrôle de l’accès aux catalogues de données à l’aide de politiques IAM
Utilisation d’un formulaire dans la console Athena pour ajouter une table AWS Glue
Optimisation des requêtes grâce à l’indexation et au filtrage des partitions AWS Glue
Utilisation de l’AWS CLI pour recréer une base de données AWS Glue et ses tables
Création de tables dans le cadre de tâches d’extraction, de transformation et de chargement (ETL)