

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Paso 1: Añadir documentos a Amazon S3
<a name="tutorial-search-metadata-add-documents"></a>

Antes de ejecutar un trabajo de análisis de entidades de Amazon Comprehend en su conjunto de datos, debe crear un bucket de Amazon S3 para alojar los datos, los metadatos y el resultado del análisis de entidades de Amazon Comprehend.

**Topics**
+ [Descarga del conjunto de datos de muestra](#tutorial-search-metadata-add-documents-download-extract)
+ [Creación de un bucket de Amazon S3](#tutorial-search-metadata-add-documents-create-bucket)
+ [Crear carpetas de datos y metadatos en su bucket de S3](#tutorial-search-metadata-add-documents-data-metadata)
+ [Cargar los datos de entrada.](#tutorial-search-metadata-add-documents-upload-data)

## Descarga del conjunto de datos de muestra
<a name="tutorial-search-metadata-add-documents-download-extract"></a>

Antes de que Amazon Comprehend pueda ejecutar un trabajo de análisis de entidades en sus datos, debe descargar y extraer el conjunto de datos y cargarlo en un bucket de S3.

### Para descargar y extraer el conjunto de datos (consola)
<a name="tutorial-search-metadata-download-extract-console"></a>

1. Descargue la carpeta [tutorial-dataset.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip) en su dispositivo.

1. Extraiga la carpeta `tutorial-dataset` para acceder a la carpeta `data`.

### Para descargar y extraer el conjunto de datos (Terminal)
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. Para descargar el `tutorial-dataset`, ejecute el siguiente comando en una ventana de terminal:

------
#### [ Linux ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Donde:
   + *path/*es la ruta del archivo local a la ubicación en la que desea guardar la carpeta zip.

------
#### [ macOS ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Donde:
   + *path/*es la ruta de archivo local a la ubicación en la que desea guardar la carpeta zip.

------
#### [ Windows ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Donde:
   + *path/*es la ruta de archivo local a la ubicación en la que desea guardar la carpeta zip.

------

1. Para extraer los datos de la carpeta zip, ejecute el siguiente comando en la ventana del terminal:

------
#### [ Linux ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Donde:
   + *path/*es la ruta de archivo local a la carpeta zip guardada.

------
#### [ macOS ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Donde:
   + *path/*es la ruta de acceso local a la carpeta zip guardada.

------
#### [ Windows ]

   ```
   tar -xf path/tutorial-dataset.zip -C path/
   ```

   Donde:
   + *path/*es la ruta de acceso local a la carpeta zip guardada.

------

Al final de este paso, deberías tener los archivos extraídos en una carpeta descomprimida llamada `tutorial-dataset`. Esta carpeta contiene un archivo `README` con una atribución de código abierto de Apache 2.0 y una carpeta llamada `data` que contiene el conjunto de datos de este tutorial. El conjunto de datos consta de 100 archivos con extensiones `.story`.

## Creación de un bucket de Amazon S3
<a name="tutorial-search-metadata-add-documents-create-bucket"></a>

Después de descargar y extraer la carpeta de datos de muestra, se almacena en un bucket de Amazon S3.

**importante**  
El nombre de un bucket de Amazon S3 debe ser único en todas las AWS.

### Para crear un bucket de S3 (Consola)
<a name="tutorial-search-metadata-create-bucket-console"></a>

1. Inicie sesión en la consola de Amazon S3 Consola de administración de AWS y ábrala en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, seleccione **Crear bucket**.

1. En **Nombre del bucket**, escriba un nombre único.

1. En **Región**, elige la AWS región en la que quieres crear el bucket.
**nota**  
Debe elegir una región que admita Amazon Comprehend y Amazon Kendra. No puede cambiar la región de un bucket después de haberlo creado.

1. Mantenga la configuración predeterminada para **Bloquear el acceso público para este bucket**, el **control de versiones del bucket** y las **etiquetas**.

1. Para el **cifrado predeterminado**, seleccione **Desactivar**.

1. Mantenga la configuración predeterminada para la **Configuración avanzada**.

1. Revise la configuración del bucket y elija **Crear bucket**.

### Para crear un bucket de S3 (AWS CLI)
<a name="tutorial-search-metadata-create-bucket-cli"></a>

1. Para crear un bucket de S3 use el comando [create-bucket](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3control/create-bucket.html) en la AWS CLI.

------
#### [ Linux ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket,
   + *aws-region*es la región en la que quieres crear tu cubo.

------
#### [ macOS ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket,
   + *aws-region*es la región en la que quieres crear tu cubo.

------
#### [ Windows ]

   ```
   aws s3api create-bucket ^
           --bucket amzn-s3-demo-bucket ^
           --region aws-region ^
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket,
   + *aws-region*es la región en la que quieres crear tu cubo.

------
**nota**  
Debe elegir una región que admita Amazon Comprehend y Amazon Kendra. No puede cambiar la región de un bucket después de haberlo creado.

1. Para asegurarse de que su bucket se creó correctamente, utilice el comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls
   ```

------
#### [ macOS ]

   ```
   aws s3 ls
   ```

------
#### [ Windows ]

   ```
   aws s3 ls
   ```

------

## Crear carpetas de datos y metadatos en su bucket de S3
<a name="tutorial-search-metadata-add-documents-data-metadata"></a>

Tras crear su bucket S3, cree carpetas de datos y metadatos en su interior.

### Para crear carpetas en su bucket de S3 (Consola)
<a name="tutorial-search-metadata-create-folders-console"></a>

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, haga clic en el nombre de su bucket de la lista.

1. En la pestaña **Objetos**, elija **Crear carpeta**.

1. Para el nombre de la nueva carpeta, escriba **data**.

1. Para la configuración de cifrado de carpeta, elija **Desactivar**.

1. Elija **Crear carpeta**.

1. Repita los pasos 3 a 6 para crear otra carpeta para almacenar los metadatos de Amazon Kendra y asigne un nombre a la carpeta creada en el paso 4 **metadata**.

### Para crear carpetas en su bucket de S3 (AWS CLI)
<a name="tutorial-search-metadata-create-folders-cli"></a>

1. Para crear la carpeta `data` en su bucket de S3, utilice el comando [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) en la AWS CLI:

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------

1. Para crear la carpeta `metadata` en su bucket de S3, utilice el comando [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) en la AWS CLI:

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key metadata/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------

1. Para asegurarse de que sus carpetas se han creado correctamente, compruebe el contenido de su bucket utilizando el comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket.

------

## Cargar los datos de entrada.
<a name="tutorial-search-metadata-add-documents-upload-data"></a>

Tras crear las carpetas de datos y metadatos, debe cargar el conjunto de datos de muestra en la carpeta `data`.

### Para cargar el conjunto de datos de muestra en la carpeta de datos (Consola)
<a name="tutorial-search-metadata-upload-data-console"></a>

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, haga clic en el nombre de su bucket de la lista y haga clic en `data`.

1. Elija **Cargar** y, a continuación, **Agregar archivo**.

1. En el cuadro de diálogo, navegue hasta la carpeta `data` incluida en la carpeta `tutorial-dataset` de su dispositivo local, seleccione todos los archivos y, a continuación, elija **Abrir**.

1. Mantenga la configuración predeterminada de **Destino**, **Permisos** y **Propiedades**.

1. Seleccione **Cargar**.

### Para cargar el conjunto de datos de muestra en la carpeta de datos (AWS CLI)
<a name="tutorial-search-metadata-upload-data-cli"></a>

1. Para cargar los datos de muestra en la carpeta `data`, utilice el comando [copy](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html) en la AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Donde:
   + *path/*es la ruta del archivo a la `tutorial-dataset` carpeta de tu dispositivo,
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ macOS ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Donde:
   + *path/*es la ruta del archivo a la `tutorial-dataset` carpeta del dispositivo,
   + amzn-s3-demo-bucket es el nombre del bucket.

------
#### [ Windows ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Donde:
   + *path/*es la ruta del archivo a la `tutorial-dataset` carpeta del dispositivo,
   + amzn-s3-demo-bucket es el nombre del bucket.

------

1. Para asegurarse de que sus archivos de conjuntos de datos se han cargado correctamente en su carpeta `data`, utilice el comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) en la AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------

Al final de este paso, dispondrá de un bucket de S3 con el conjunto de datos almacenado en la carpeta `data` y de una carpeta `metadata` vacía en la que se almacenarán los metadatos de Amazon Kendra.