Coleta de dados - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Coleta de dados

Você pode coletar dados de várias fontes na AWS, mas é importante escolher a ferramenta de coleta de dados certa para seu caso de uso. O diagrama a seguir mostra como a etapa de coleta de dados se encaixa no ciclo de vida de automação e controle de acesso da engenharia de dados.

Diagrama de coleta de dados

A AWS fornece as seguintes ferramentas de coleta de dados:

  • O Amazon Kinesis ajuda você a coletar dados de streaming. O Kinesis também oferece recursos de integração e processamento perfeitos.

  • O AWS Database Migration Service (AWS DMS) ajuda você a ingerir dados de bancos de dados relacionais. O AWS DMS tem opções de configuração e conexões diretas entre serviços on-premises e de banco de dados, como o Amazon Simple Storage Service (Amazon S3), que são hospedados na AWS.

  • O AWS Glue é uma ferramenta de extração, transformação e carregamento (ETL) que ajuda você a ingerir dados não estruturados.

Há vários casos de uso para coletar dados não estruturados ou semiestruturados usando o Amazon S3 para armazenamento. Por exemplo, o caso de uso de coleta de dados de um site de manufatura pode exigir que dados históricos sejam ingeridos para dados históricos da máquina como arquivos XML, dados de eventos como arquivos JSON e dados de compra de um banco de dados relacional. Esse caso de uso também pode exigir que todas as três fontes de dados sejam unidas.

Antes de iniciar o processo de ingestão de dados, recomendamos que você entenda quais dados devem ser ingeridos e escolha a ferramenta certa para coletar esses dados.