Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Collecte des données
Vous pouvez collecter des données à partir de diverses sources au sein d'AWS, mais il est important de choisir l'outil de collecte de données adapté à votre cas d'utilisation. Le schéma suivant montre comment l'étape de collecte des données s'inscrit dans le cycle de vie de l'automatisation de l'ingénierie des données et du contrôle d'accès.
AWS fournit les outils de collecte de données suivants :
-
Amazon Kinesis
vous aide à collecter des données de streaming. Kinesis propose également des fonctionnalités d'intégration et de traitement fluides. -
AWS Database Migration Service (AWS DMS)
vous aide à ingérer des données provenant de bases de données relationnelles. AWS DMS propose des options de configuration et des connexions directes entre les services sur site et les services de base de données, tels qu'Amazon Simple Storage Service (Amazon S3), hébergés sur AWS. -
AWS Glue
est un outil d'extraction, de transformation et de chargement (ETL) qui vous aide à ingérer des données non structurées.
Il existe plusieurs cas d'utilisation pour collecter des données non structurées ou semi-structurées à l'aide d'Amazon S3 pour le stockage. Par exemple, le cas d'utilisation de la collecte de données sur un site de fabrication peut nécessiter l'ingestion de données historiques pour les données d'historique des machines sous forme de fichiers XML, les données d'événements sous forme de fichiers JSON et les données d'achat provenant d'une base de données relationnelle. Ce cas d'utilisation peut également nécessiter que les trois sources de données soient jointes.
Avant de commencer le processus d'ingestion de données, nous vous recommandons de comprendre quelles données doivent être ingérées, puis de choisir le bon outil pour collecter ces données.