

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Preparación e importación de datos masivos con Amazon SageMaker AI Data Wrangler
<a name="preparing-importing-with-data-wrangler"></a>

**importante**  
Al usar Data Wrangler, incurre en costos de IA. SageMaker Para obtener una lista completa de cargos y precios, consulta la pestaña Data Wrangler de los precios de [Amazon SageMaker AI](https://aws.amazon.com/sagemaker/pricing/). Para evitar incurrir en cargos adicionales, cuando haya terminado, cierre su instancia de Data Wrangler. Para obtener más información, consulte [Apagar Data Wrangler](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html). 

Después de crear un grupo de conjuntos de datos, puede usar Amazon SageMaker AI Data Wrangler (Data Wrangler) para importar datos de más de 40 fuentes a un conjunto de datos de Amazon Personalize. Data Wrangler es una función de Amazon SageMaker AI Studio Classic que proporciona una end-to-end solución para importar, preparar, transformar y analizar datos. No se puede usar Data Wrangler para preparar e importar datos en un conjunto de datos de acciones ni en un conjunto de datos de interacciones de acción.

 Cuando utiliza Data Wrangler para preparar e importar datos, emplea un flujo de datos. Un *flujo de datos* define una serie de pasos de preparación de datos mediante machine learning, empezando por la importación de datos. Cada vez que añade un paso a su flujo, Data Wrangler realiza una acción con sus datos, como transformarlos o generar una visualización. 

Estos son algunos de los pasos que puede añadir a su flujo para preparar datos para Amazon Personalize:
+ **Estadísticas**: puede añadir pasos de información específicos de Amazon Personalize a su flujo. Esta información puede ayudarle a conocer sus datos y a saber qué medidas puede llevar a cabo para mejorarlos.
+ **Visualizaciones**: puede añadir pasos de visualización para generar gráficos, como histogramas y gráficos de dispersión. Los gráficos pueden ayudarle a detectar problemas en los datos, como valores atípicos o valores que faltan.
+ **Transformaciones**: puede utilizar los pasos de transformación específicos y generales de Amazon Personalize para asegurarse de que sus datos cumplen los requisitos de Amazon Personalize. La transformación de Amazon Personalize le ayuda a asignar sus columnas de datos a las columnas obligatorias en función del tipo de conjunto de datos de Amazon Personalize.

Si necesita salir de Data Wrangler antes de importar datos en Amazon Personalize, puede volver a donde los dejó eligiendo el mismo tipo de conjunto de datos al [iniciar Data Wrangler desde la consola de Amazon Personalize](dw-launch-dw-from-personalize.md). O bien, puede acceder a Data Wrangler directamente a través SageMaker de AI Studio Classic.

 Recomendamos que importe los datos de Data Wrangler en Amazon Personalize de la siguiente manera. Los pasos de transformación, visualización y análisis son opcionales, repetibles y se pueden completar en cualquier orden. 

1. **[Configurar permisos](dw-data-prep-minimum-permissions.md)**: configure los permisos para las funciones de servicio Amazon Personalize y SageMaker AI. Y configure los permisos para sus usuarios.

1. **[Inicie Data Wrangler en SageMaker AI Studio Classic desde la consola Amazon Personalize: utilice la consola](dw-launch-dw-from-personalize.md)** Amazon Personalize para configurar un dominio de SageMaker IA e inicie Data Wrangler en SageMaker AI Studio Classic.

1. **[Importar sus datos en Data Wrangler](dw-import-data.md)**: importe datos de más de 40 orígenes en Data Wrangler. Las fuentes incluyen AWS servicios, como Amazon Redshift, Amazon EMR o Amazon Athena, y terceros, como Snowflake o. DataBricks

1. **[Transformar sus datos](dw-transform-data.md)**: utilice Data Wrangler para transformar sus datos y cumplir con los requisitos de Amazon Personalize.

1. **[Visualizar y analizar sus datos](dw-analyze-data.md)**: utilice Data Wrangler para visualizar sus datos y analizarlos mediante información específica de Amazon Personalize.

1. **[Procese e importe datos a Amazon Personalize](dw-export-data.md)**: utilice una libreta Jupyter clásica de SageMaker AI Studio para importar los datos procesados a Amazon Personalize.

## Información adicional
<a name="dw-additional-info"></a>

Los siguientes recursos proporcionan información adicional sobre el uso de Amazon SageMaker AI Data Wrangler y Amazon Personalize.
+ Para ver un tutorial que le guiará a través del procesamiento y la transformación de un conjunto de datos de muestra, consulte [Demo: Tutorial del conjunto de datos Data Wrangler Titanic en](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-getting-started.html#data-wrangler-getting-started-demo) la Guía para desarrolladores de *Amazon SageMaker * AI. Este tutorial presenta los campos y las funciones de Data Wrangler.
+ Para obtener información sobre la incorporación a los dominios de Amazon SageMaker AI, consulte Incorporación [rápida a Amazon SageMaker AI Domain](https://docs.aws.amazon.com/sagemaker/latest/dg/onboard-quick-start.html) en la *Guía para desarrolladores de Amazon SageMaker AI*.
+ Para obtener información sobre los requisitos de datos de Amazon Personalize, consulte [Preparación de los datos de entrenamiento para Amazon Personalize](preparing-training-data.md).