

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Prepare datos de aprendizaje automático con Amazon SageMaker Data Wrangler
<a name="data-wrangler"></a>

**importante**  
Amazon SageMaker Data Wrangler se ha integrado en Amazon SageMaker Canvas. Con la nueva experiencia Data Wrangler en SageMaker Canvas, además de la interfaz visual, puede utilizar una interfaz de lenguaje natural para explorar y transformar sus datos. Para obtener más información sobre Data Wrangler en SageMaker Canvas, consulte. [Preparación de datos](canvas-data-prep.md)

Amazon SageMaker Data Wrangler (Data Wrangler) es una función de Amazon SageMaker Studio Classic que proporciona una end-to-end solución para importar, preparar, transformar, caracterizar y analizar datos. Puede integrar un flujo de preparación de datos de Data Wrangler en sus flujos de trabajo de machine learning (ML) a fin de simplificar y agilizar el preprocesamiento de datos y la ingeniería de características sin apenas codificación. También puede añadir sus propios scripts y transformaciones de Python para personalizar flujos de trabajo.

Data Wrangler proporciona las siguientes funcionalidades principales para ayudarle a analizar y preparar los datos para las aplicaciones de machine learning. 
+ **Importación**: Conéctese e importe datos de Amazon Simple Storage Service (Amazon S3), Amazon Athena (Athena), Amazon Redshift, Snowflake y Databricks.
+ **Flujo de datos**: cree un flujo de datos para definir una serie de pasos de preparación de datos para el ML. Puede usar un flujo para combinar conjuntos de datos de diferentes orígenes, identificar el número y los tipos de transformaciones que desea aplicar a los conjuntos de datos y definir un flujo de trabajo de preparación de datos que se pueda integrar en una canalización de ML. 
+ **Transformación**: limpie y transforme su conjunto de datos mediante *transformaciones* estándar, como herramientas de formato para datos numéricos, vectoriales y de cadenas. Personalice sus datos mediante transformaciones como texto, incrustaciones y codificación categórica. date/time 
+ **Generación de información sobre los datos**: verifique automáticamente la calidad de los datos y detecte anomalías en estos con Data Wrangler Data Insights y Quality Report. 
+ **Análisis**: analice las características de su conjunto de datos en cualquier punto del flujo. Data Wrangler incluye herramientas integradas de visualización de datos, como diagramas de dispersión e histogramas; también dispone de herramientas para el análisis de datos, como el análisis de fuga de objetivos y el modelado rápido para comprender la correlación de características. 
+ **Exportación**: exporte su flujo de trabajo de preparación de datos a una ubicación distinta. A continuación, se muestran algunos ejemplos de ubicaciones. 
  + Bucket de Amazon Simple Storage Service (Amazon S3)
  + Amazon SageMaker Pipelines: utilice Pipelines para automatizar la implementación de modelos. Puede exportar los datos que ha transformado directamente en las canalizaciones.
  + Amazon SageMaker Feature Store: almacene las funciones y sus datos en una tienda centralizada.
  + Script de Python. Almacene los datos y sus transformaciones en un script de Python para sus flujos de trabajo personalizados.

Para empezar a utilizar Data Wrangler, consulte [Introducción a Data Wrangler](data-wrangler-getting-started.md).

**importante**  
Data Wrangler ya no es compatible con la versión 1 () de Jupyter Lab. JL1 Para acceder a las últimas características y mejoras, actualice a la versión 3 de Jupyter Lab. Para obtener más información acerca de la actualización, consulte [Vea y actualice la JupyterLab versión de una aplicación desde la consola](studio-jl.md#studio-jl-view).

**importante**  
La información y los procedimientos de esta guía utilizan la versión más reciente de Amazon SageMaker Studio Classic. Para obtener más información sobre cómo actualizar Studio Classic a la última versión, consulte [Descripción general de la interfaz de usuario clásica de Amazon SageMaker Studio](studio-ui.md).

Debe utilizar la versión 1.3.0 de Studio Classic o posteriores. Utilice el siguiente procedimiento para abrir Amazon SageMaker Studio Classic y ver qué versión está ejecutando.

Para abrir Studio Classic y comprobar su versión, consulte el siguiente procedimiento.

1. Sigue los pasos que se indican [Requisitos previos](data-wrangler-getting-started.md#data-wrangler-getting-started-prerequisite) a continuación para acceder a Data Wrangler a través de Amazon SageMaker Studio Classic.

1. Junto al usuario que desee utilizar para inicializar Studio Classic, seleccione **Lanzar aplicación**.

1. Elija **Studio**.

1. Cuando Studio Classic se cargue, seleccione **Archivo**, **Nuevo** y, por último, **Terminal**.  
![Las opciones del menú contextual de Studio Classic descritas en el paso 4.](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/studio/mohave/terminal.png)

1. Tras iniciar Studio Classic, seleccione **Archivo**, **Nuevo** y, por último, **Terminal**.

1. Introduzca `cat /opt/conda/share/jupyter/lab/staging/yarn.lock | grep -A 1 "@amzn/sagemaker-ui-data-prep-plugin@"` para imprimir la versión de su instancia de Studio Classic. Para utilizar Snowflake, debe tener la versión 1.3.0 de Studio Classic.   
![Debe tener abierta una ventana de terminal en Studio Classic con el comando del paso 6 copiado y pegado.](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/studio/mohave/cat-command.png)

Puede actualizar Amazon SageMaker Studio Classic desde Consola de administración de AWS. Para obtener más información sobre la actualización de Studio Classic, consulte [Descripción general de la interfaz de usuario clásica de Amazon SageMaker Studio](studio-ui.md).

**Topics**
+ [Introducción a Data Wrangler](data-wrangler-getting-started.md)
+ [Importación](data-wrangler-import.md)
+ [Creación y uso de un flujo de Data Wrangler](data-wrangler-data-flow.md)
+ [Información sobre los datos y la calidad de los datos](data-wrangler-data-insights.md)
+ [Entrenamiento automático de modelos en su flujo de datos](data-wrangler-autopilot.md)
+ [Datos de transformación](data-wrangler-transform.md)
+ [Análisis y visualización](data-wrangler-analyses.md)
+ [Reutilización de flujos de datos para diferentes conjuntos de datos](data-wrangler-parameterize.md)
+ [Exportación](data-wrangler-data-export.md)
+ [Utilice un widget interactivo de preparación de datos en un bloc de notas clásico de Amazon SageMaker Studio para obtener información valiosa sobre los datos](data-wrangler-interactively-prepare-data-notebook.md)
+ [Seguridad y permisos](data-wrangler-security.md)
+ [Notas de la versión](data-wrangler-release-notes.md)
+ [Solucionar problemas](data-wrangler-trouble-shooting.md)
+ [Aumentar el límite de instancias de Amazon EC2](data-wrangler-increase-instance-limit.md)
+ [Actualización de Data Wrangler](data-wrangler-update.md)
+ [Apagado de Data Wrangler](data-wrangler-shut-down.md)