Preparação e importação de dados usando o Amazon SageMaker AI Data Wrangler
Importante
Ao usar o Data Wrangler, você incorre em custos do SageMaker AI. Para obter uma lista completa de cobranças e preços, consulte a guia Preços do Amazon SageMaker AI
Depois de criar um grupo de conjuntos de dados, você pode usar o Amazon SageMaker AI Data Wrangler (Data Wrangler) para importar dados de mais de 40 fontes para um conjunto de dados do Amazon Personalize. O Data Wrangler é um recurso do Amazon SageMaker AI Studio Classic que oferece uma solução completa para importar, preparar, transformar e analisar dados. Não é possível usar o Data Wrangler para preparar e importar dados para um conjunto de dados de ações nem de interações com ações.
Ao usar o Data Wrangler para preparar e importar dados, você usa um fluxo de dados. Um fluxo de dados define uma série de etapas de preparação de dados de machine learning, começando com a importação de dados. Cada vez que você adiciona uma etapa ao seu fluxo, o Data Wrangler executa uma ação em seus dados, como transformá-los ou gerar uma visualização.
Veja abaixo algumas etapas que você pode adicionar ao fluxo para preparar dados para o Amazon Personalize:
-
Insights: você pode adicionar etapas de insights específicas do Amazon Personalize ao seu fluxo. Esses insights podem ajudar você a aprender sobre seus dados e quais ações você pode tomar para melhorá-los.
-
Visualizações: você pode adicionar etapas de visualização para gerar gráficos, como histogramas e gráficos de dispersão. Os gráficos podem ajudar você a descobrir problemas em seus dados, como valores discrepantes ou valores ausentes.
-
Transformações: você pode usar as etapas de transformação específicas e gerais do Amazon Personalize para garantir que seus dados atendam aos requisitos do Amazon Personalize. A transformação do Amazon Personalize ajuda você a mapear suas colunas de dados para as colunas necessárias, dependendo do tipo de conjunto de dados do Amazon Personalize.
Se precisar sair do Data Wrangler antes de importar dados para o Amazon Personalize, você pode retomar de onde parou escolhendo o mesmo tipo de conjunto de dados ao iniciar o Data Wrangler no console do Amazon Personalize. Também é possível acessar o Data Wrangler diretamente pelo SageMaker AI Studio Classic.
Recomendamos que você importe dados do Data Wrangler para o Amazon Personalize da seguinte forma. As etapas de transformação, visualização e análise são opcionais, repetíveis e podem ser concluídas em qualquer ordem.
-
Configurar permissões: configure permissões para os perfis de serviço do Amazon Personalize e do SageMaker AI. E configure permissões para seus usuários.
-
Iniciar o Data Wrangler no SageMaker AI Studio Classic pelo console do Amazon Personalize: use o console do Amazon Personalize para configurar um domínio do SageMaker AI e iniciar o Data Wrangler no SageMaker AI Studio Classic.
-
Importar seus dados para o Data Wrangler - Importe dados de mais de 40 fontes para o Data Wrangler. As fontes incluem serviços do AWS, como o Amazon Redshift, Amazon EMR ou Amazon Athena, e de terceiros, como Snowflake ou DataBricks.
-
Transformar seus dados - Use o Data Wrangler para transformar seus dados e atender aos requisitos do Amazon Personalize.
-
Visualizar e analisar seus dados - Use o Data Wrangler para visualizar seus dados e analisá-los por meio de insights específicos do Amazon Personalize.
-
Processar e importar dados para o Amazon Personalize: use um caderno Jupyter do SageMaker AI Studio Classic para importar os dados processados para o Amazon Personalize.
Mais informações
Os recursos a seguir fornecem informações adicionais sobre o uso do Amazon SageMaker AI Data Wrangler e do Amazon Personalize.
-
Para ver um tutorial sobre processamento e transformação de um conjunto de dados de amostra, consulte Demonstração: Passo a passo do conjunto de dados do Data Wrangler Titanic no Guia do desenvolvedor do Amazon SageMaker AI. Este tutorial apresenta os campos e as funções do Data Wrangler.
-
Para obter informações sobre a integração aos domínios do Amazon SageMaker, consulte Integração ao domínio do Amazon SageMaker AI usando a configuração rápida no Guia do desenvolvedor do Amazon SageMaker AI.
-
Para obter informações sobre os requisitos de dados do Amazon Personalize, consulte Preparar os dados de treinamento para o Amazon Personalize.