

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Transformação de dados
<a name="dw-transform-data"></a>

 Para transformar dados no Data Wrangler, você adiciona uma etapa de **Transformação** ao seu fluxo de dados. O Data Wrangler inclui mais de 300 transformações que você pode usar para preparar seus dados, incluindo uma transformação **Mapear colunas para o Amazon Personalize**. E você pode usar as transformações gerais do Data Wrangler para corrigir problemas como valores discrepantes, problemas de tipo e valores ausentes. 

Depois de concluir a transformação dos dados, você pode analisá-los com o Data Wrangler. Ou, se você terminar de preparar seus dados no Data Wrangler, poderá processá-los e importá-los para o Amazon Personalize. Para obter informações sobre a análise de dados, consulte [Geração de visualizações e insights de dados](dw-analyze-data.md). Para obter informações sobre processamento e importação de dados, consulte [Processar dados e importá-los para o Amazon Personalize](dw-export-data.md).

**Topics**
+ [Mapear colunas para o Amazon Personalize](#dw-personalize-transform)
+ [Transformações gerais do Data Wrangler](#dw-general-transform)

## Mapear colunas para o Amazon Personalize
<a name="dw-personalize-transform"></a>

 Para transformar seus dados para que eles atendam aos requisitos do Amazon Personalize, você adiciona a transformação **Mapear colunas para a do Amazon Personalize** e mapeia suas colunas para os campos obrigatórios e opcionais do Amazon Personalize.

**Para usar a transformação Mapear colunas para a do Amazon Personalize**

1.  Selecione **\$1** para sua última transformação e escolha **Adicionar transformação**. Se você não tiver adicionado uma transformação, selecione o **\$1** para a transformação de **Tipos de dados**. O Data Wrangler adiciona essa transformação automaticamente ao seu fluxo. 

1.  Selecione **Adicionar etapa**. 

1.  Selecione **Transformações para o Amazon Personalize**. A transformação **Mapear colunas para o Amazon Personalize** é selecionada por padrão. 

1. Use os campos de transformação para mapear seus dados de acordo com os atributos necessários do Amazon Personalize.

   1. Selecione o tipo de conjunto de dados que corresponde aos seus dados (interações, itens ou usuários). 

   1. Selecione seu domínio (ECOMMERCE, VIDEO\$1ON\$1DEMAND ou personalizado). O domínio selecionado deve corresponder ao domínio que você especificou ao criar seu grupo de conjuntos de dados.

   1. Escolha as colunas que correspondem aos campos obrigatórios e opcionais do Amazon Personalize. Por exemplo, para a coluna Item\$1ID, escolha a coluna em seus dados que armazena as informações de identificação exclusivas de cada um dos seus itens. 

      Cada campo da coluna é filtrado por tipo de dados. Somente as colunas em seus dados que atendem aos requisitos de tipo de dados do Amazon Personalize ficam disponíveis. Se seus dados não forem do tipo necessário, você poderá usar a transformação [Analisar valor como tipo](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) do Data Wrangler para convertê-los.

## Transformações gerais do Data Wrangler
<a name="dw-general-transform"></a>

 As seguintes transformações gerais do Data Wrangler podem ajudar você a preparar dados para o Amazon Personalize: 
+ Conversão do tipo de dados: se o seu campo não estiver listado como uma opção possível na transformação **Mapear colunas para o Amazon Personalize**, talvez seja necessário converter o tipo de dados. A transformação [Analisar valor como tipo](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-cast-type) do Data Wrangler pode ajudar você a converter seus dados. Ou você pode usar a transformação **Tipos de dados** que o Data Wrangler adiciona por padrão ao criar um fluxo. Para usar essa transformação, escolha o tipo de dados nas listas suspensas **Tipo**, escolha **Visualizar** e, em seguida, selecione **Atualizar**.

   Para obter informações sobre os tipos de dados obrigatórios para campos, consulte a seção sobre seu domínio e tipo de conjunto de dados em [Criar arquivos JSON de esquema para esquemas do Amazon Personalize](how-it-works-dataset-schema.md). 
+ Tratamento de valores ausentes e valores discrepantes: se você gerar valores ausentes ou insights discrepantes, poderá usar as transformações do Data Wrangler para [Tratar valores discrepantes](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-outlier) e [Tratar valores ausentes](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-handle-missing) para resolver esses problemas. 
+  Transformações personalizadas: com o Data Wrangler, você pode criar suas próprias transformações com Python (função definida pelo usuário) PySpark, pandas ou (SQL). PySpark Você pode usar uma transformação personalizada para realizar tarefas como eliminar colunas duplicadas ou agrupar por colunas. Para obter mais informações, consulte [Transformações personalizadas](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-transform.html#data-wrangler-transform-custom) no *Amazon SageMaker AI Developer Guide*. 