View a markdown version of this page

AWS Glue DataBrew - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

AWS Glue DataBrew

O AWS Glue DataBrew é um serviço de preparação visual de dados totalmente gerenciado para limpeza, normalização e transformação de dados. Ele difere do ETL do AWS Glue porque você não precisa escrever código para trabalhar com ele. O DataBrew fornece mais de 250 transformações integradas, com uma interface visual de apontar e clicar para criar e gerenciar trabalhos de transformação de dados.

O DataBrew está disponível em uma visualização de console separada do AWS Glue. Ele é nativamente integrado a vários serviços da AWS e oferece suporte a vários formatos de arquivo diferentes. Para obter mais informações, consulte Integrações de produtos e serviços.

O DataBrew é baseado nos seguintes seis conceitos principais:

  • Projeto: todo o espaço de trabalho de preparação de dados no DataBrew

  • Conjunto de dados: uma coleção de dados estruturados ou semiestruturados

  • Fórmula: um conjunto de etapas de transformação de dados; cada etapa pode conter muitas ações

  • Trabalho: um conjunto de instruções para executar uma fórmula ou um trabalho de perfil de dados 

  • Linhagem de dados: o rastreamento de dados em uma interface visual para identificar sua origem

  • Perfil de dados: uma visão resumida da forma dos seus dados

O AWS Glue DataBrew é integrado ao AWS Glue Studio, permitindo orquestrar fórmulas do DataBrew em trabalhos e fluxos de trabalho de ETL do AWS Glue. As fórmulas do DataBrew também podem aproveitar recursos do AWS Glue, como marcadores de trabalhos, novas tentativas automáticas e escalabilidade automática. Para começar a usar o DataBrew, use o tutorial de exemplo do projeto do AWS Glue DataBrew.