Accès au catalogue de données - AWS Glue

Accès au catalogue de données

Vous pouvez utiliser l’AWS Glue Data Catalog (catalogue de données) pour découvrir et comprendre vos données. Le catalogue de données fournit un moyen cohérent de gérer les définitions de schéma, les types de données, les emplacements et les autres métadonnées. Vous pouvez accéder au catalogue de données à l’aide des méthodes suivantes :

  • Console AWS Glue : vous pouvez accéder au catalogue de données et le gérer via la console AWS Glue, une interface utilisateur Web. La console vous permet de parcourir et de rechercher des bases de données, des tables et leurs métadonnées associées, ainsi que de créer, mettre à jour et supprimer des définitions de métadonnées.

  • AWS Glue crawler : les robots sont des programmes qui analysent automatiquement vos sources de données et alimentent le catalogue de données avec des métadonnées. Vous pouvez créer et exécuter des robots pour découvrir et cataloguer des données provenant de diverses sources telles qu’Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon CloudWatch et de bases de données relationnelles compatibles JDBC telles que MySQL et PostgreSQL, ainsi que de plusieurs sources autres qu’AWS, telles que Snowflake et Google BigQuery.

  • API AWS Glue : vous pouvez accéder au catalogue de données par programmation à l’aide des API AWS Glue. Ces API vous permettent d’interagir avec le catalogue de données par programmation, ce qui permet l’automatisation et l’intégration avec d’autres applications et services.

  • AWS Command Line Interface (AWS CLI) : vous pouvez utiliser l’AWS CLI pour accéder au catalogue de données et le gérer à partir de la ligne de commande. La CLI fournit des commandes pour créer, mettre à jour et supprimer des définitions de métadonnées, ainsi que pour interroger et récupérer des informations de métadonnées.

  • Intégration avec d’autres services AWS : le catalogue de données s’intègre à divers autres services AWS, ce qui vous permet d’accéder aux métadonnées stockées dans le catalogue et de les utiliser. Par exemple, vous pouvez utiliser Amazon Athena pour interroger des sources de données à l’aide des métadonnées du catalogue de données et utiliser AWS Lake Formation pour gérer l’accès aux données et la gouvernance des ressources du catalogue de données.