

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Etapa 1: adicionando documentos ao Amazon S3
<a name="tutorial-search-metadata-add-documents"></a>

Antes de executar um trabalho de análise de entidades do Amazon Comprehend no conjunto de dados, você cria um bucket do Amazon S3 para hospedar os dados, os metadados e a saída da análise de entidades do Amazon Comprehend.

**Topics**
+ [Baixar o conjunto de dados de amostra](#tutorial-search-metadata-add-documents-download-extract)
+ [Como criar um bucket do Amazon S3](#tutorial-search-metadata-add-documents-create-bucket)
+ [Criação de pastas de dados e metadados no bucket do S3](#tutorial-search-metadata-add-documents-data-metadata)
+ [Carregue os dados de entrada](#tutorial-search-metadata-add-documents-upload-data)

## Baixar o conjunto de dados de amostra
<a name="tutorial-search-metadata-add-documents-download-extract"></a>

Antes que o Amazon Comprehend possa executar um trabalho de análise de entidades em seus dados, você deve baixar e extrair o conjunto de dados e carregá-lo em um bucket do S3.

### Para baixar e extrair o conjunto de dados (console)
<a name="tutorial-search-metadata-download-extract-console"></a>

1. Baixe a pasta [tutorial-dataset.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip) em seu dispositivo.

1. Extraia a pasta `tutorial-dataset` para acessar a pasta `data`.

### Para baixar e extrair o conjunto de dados (terminal)
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. Faça o download de `tutorial-dataset`, execute o seguinte comando na janela do terminal:

------
#### [ Linux ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o local em que você deseja salvar a pasta zip.

------
#### [ macOS ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o local em que você deseja salvar a pasta zip.

------
#### [ Windows ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o local em que você deseja salvar a pasta zip.

------

1. Para extrair os dados da pasta zip, execute o seguinte comando na janela do terminal:

------
#### [ Linux ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Em que:
   + *path/*é o caminho do arquivo local para sua pasta zip salva.

------
#### [ macOS ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Em que:
   + *path/*é o caminho do arquivo local para sua pasta zip salva.

------
#### [ Windows ]

   ```
   tar -xf path/tutorial-dataset.zip -C path/
   ```

   Em que:
   + *path/*é o caminho do arquivo local para sua pasta zip salva.

------

No final desta etapa, você deve ter os arquivos extraídos em uma pasta descompactada chamada `tutorial-dataset`. Essa pasta contém um arquivo `README` com uma atribuição de código aberto do Apache 2.0 e uma pasta chamada `data` contendo o conjunto de dados deste tutorial. O conjunto de dados consiste em 100 arquivos com `.story` extensões.

## Como criar um bucket do Amazon S3
<a name="tutorial-search-metadata-add-documents-create-bucket"></a>

Depois de baixar e extrair a pasta de dados de amostra, você a armazena em um bucket do Amazon S3.

**Importante**  
O nome do bucket do Amazon S3 deve ser exclusivo em todos os AWS.

### Para criar um bucket do S3 (console)
<a name="tutorial-search-metadata-create-bucket-console"></a>

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon S3 em. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Em **Buckets**, escolha **Criar bucket**.

1. Em **Bucket name** (Nome do bucket), insira um nome exclusivo.

1. Em **Região**, escolha a AWS região em que você deseja criar o bucket.
**nota**  
Você deve escolher uma região que ofereça suporte ao Amazon Comprehend e ao Amazon Kendra. Não é possível alterar a região de um bucket após sua criação.

1. Deixe as configurações padrão para Propriedade do objeto, **Configurações de bucket para bloquear acesso público**, **Versionamento de bucket** e **Tags**.

1. Em **Criptografia padrão**, escolha **Desabilitar**.

1. Mantenha as configurações padrão para as **Configurações avançadas**.

1. Revise as configurações do bucket e escolha **Criar bucket**.

### Para criar um bucket do S3 (AWS CLI)
<a name="tutorial-search-metadata-create-bucket-cli"></a>

1. Para criar um bucket do S3, use o comando [create-bucket](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3control/create-bucket.html) na AWS CLI:

------
#### [ Linux ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket;
   + *aws-region*é a região na qual você deseja criar seu bucket.

------
#### [ macOS ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket;
   + *aws-region*é a região na qual você deseja criar seu bucket.

------
#### [ Windows ]

   ```
   aws s3api create-bucket ^
           --bucket amzn-s3-demo-bucket ^
           --region aws-region ^
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket;
   + *aws-region*é a região na qual você deseja criar seu bucket.

------
**nota**  
Você deve escolher uma região que ofereça suporte ao Amazon Comprehend e ao Amazon Kendra. Não é possível alterar a região de um bucket após sua criação.

1. Para garantir que o bucket foi criado com êxito, execute o comando [lista](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls
   ```

------
#### [ macOS ]

   ```
   aws s3 ls
   ```

------
#### [ Windows ]

   ```
   aws s3 ls
   ```

------

## Criação de pastas de dados e metadados no bucket do S3
<a name="tutorial-search-metadata-add-documents-data-metadata"></a>

Depois de criar o bucket do S3, crie pastas de dados e metadados nele.

### Para criar pastas no bucket do S3 (console)
<a name="tutorial-search-metadata-create-folders-console"></a>

1. Abra o console do Amazon S3 em [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Em **Buckets**, clique no nome do bucket na lista de buckets.

1. Na guia **Objetos**, escolha **Criar pasta**.

1. Para o novo nome da pasta, insira **data**.

1. Para a configuração de criptografia, escolha **Desabilitar**.

1. Selecione **Criar pasta**.

1. Repita as etapas 3 a 6 para criar outra pasta para armazenar os metadados do Amazon Kendra e nomeie a pasta criada na etapa 4. **metadata**

### Para criar pastas no bucket do S3 (AWS CLI)
<a name="tutorial-search-metadata-create-folders-cli"></a>

1. Para criar a pasta `data` n bucket do S3, use o comando [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) no AWS CLI:

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------

1. Para criar a pasta `metadata` n bucket do S3, use o comando [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) no AWS CLI:

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key metadata/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------

1. Para garantir que as pastas tenham sido criadas com sucesso, verifique o conteúdo do bucket usando o comando [lista](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket.

------

## Carregue os dados de entrada
<a name="tutorial-search-metadata-add-documents-upload-data"></a>

Depois de criar pastas de dados e metadados, carregue o conjunto de dados de amostra na pasta `data`.

### Para carregar o conjunto de dados de amostra na pasta de dados (Console)
<a name="tutorial-search-metadata-upload-data-console"></a>

1. Abra o console do Amazon S3 em [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Em **Buckets**, clique no nome do bucket na lista e clique em `data`.

1. Selecione **Adicionar arquivo** e clique em **Carregar arquivo**.

1. Na caixa de diálogo, navegue até a pasta `data` dentro da pasta `tutorial-dataset` em seu dispositivo local, selecione todos os arquivos e escolha **Abrir**.

1. Mantenha as configurações padrão para **Destino**, **Permissões** e **Propriedades**.

1. Escolha **Carregar**.

### Para carregar o conjunto de dados de amostra na pasta de dados (AWS CLI)
<a name="tutorial-search-metadata-upload-data-cli"></a>

1. Para carregar os dados de amostra na pasta, use o comando `data` [copiar](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html) em AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Em que:
   + *path/*é o caminho do arquivo para a `tutorial-dataset` pasta no seu dispositivo,
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ macOS ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Em que:
   + *path/*é o caminho do arquivo para a `tutorial-dataset` pasta no seu dispositivo,
   + amzn-s3-demo-bucket é o nome do bucket.

------
#### [ Windows ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Em que:
   + *path/*é o caminho do arquivo para a `tutorial-dataset` pasta no seu dispositivo,
   + amzn-s3-demo-bucket é o nome do bucket.

------

1. Para garantir que os arquivos do conjunto de dados tenham sido enviados com sucesso para a pasta `data`, use o comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) na AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------

Ao final desta etapa, você terá um bucket do S3 com o conjunto de dados armazenado dentro da pasta `data` e uma pasta `metadata` vazia, que armazenará os metadados do Amazon Kendra.