

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Etapa 3: formatar a saída da análise de entidades como metadados do Amazon Kendra
<a name="tutorial-search-metadata-format-output"></a>

Para converter as entidades extraídas pelo Amazon Comprehend para o formato de metadados exigido por um índice do Amazon Kendra, execute um script Python 3. Os resultados da conversão são armazenados na pasta `metadata` do bucket da Amazon S3.

Para obter mais informações sobre o formato e a estrutura dos metadados do Amazon Kendra, consulte [Metadados do documento do S3.](https://docs.aws.amazon.com/kendra/latest/dg/s3-metadata.html)

**Topics**
+ [Baixando e extraindo a saída do Amazon Comprehend](#tutorial-search-metadata-format-output-download-extract)
+ [Carregando a saída no bucket do S3](#tutorial-search-metadata-format-output-upload)
+ [Conversão da saída para o formato de metadados do Amazon Kendra](#tutorial-search-metadata-format-output-script)
+ [Como limpar o bucket do Amazon S3](#tutorial-search-metadata-format-output-cleanup)

## Baixando e extraindo a saída do Amazon Comprehend
<a name="tutorial-search-metadata-format-output-download-extract"></a>

Para formatar a saída da análise de entidades do Amazon Comprehend, você deve primeiro baixar o arquivo de análise de entidades do Amazon Comprehend do `output.tar.gz` e extrair o arquivo de análise de entidades.

### Para baixar e extrair os arquivos de saída (console)
<a name="tutorial-search-metadata-download-extract-console"></a>

1. No console do Amazon Comprehend, no painel de navegação, acesse às **Tarefas de análise**..

1. Escolha sua tarefa de análise de entidades `data-entities-analysis`.

1. Em **Saída**, escolha o link exibido ao lado do **Local dos dados de saída**. Isso redireciona você para o arquivo de `output.tar.gz` em seu bucket do S3.

1. Na página **Visão geral** selecione **Fazer download**.
**dica**  
A saída de todos os trabalhos de análise do Amazon Comprehend tem o mesmo nome. Renomear p arquivo ajudará você a rastreá-lo com mais facilidade.

1. Descompacte e extraia o arquivo do Amazon Comprehend baixado para o seu dispositivo.

### Para baixar e extrair os arquivos de saída (AWS CLI)
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. Para acessar o nome da pasta gerada automaticamente pelo Amazon Comprehend em seu bucket do S3 que contém os resultados do trabalho de análise de entidades, use o comando: [describe-entities-detection-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/comprehend/describe-entities-detection-job.html)

------
#### [ Linux ]

   ```
   aws comprehend describe-entities-detection-job \
             --job-id entities-job-id \
             --region aws-region
   ```

   Em que:
   + *entities-job-id*você está salvo `comprehend-job-id` de[Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend](tutorial-search-metadata-entities-analysis.md),
   + *aws-region*é a sua AWS região.

------
#### [ macOS ]

   ```
   aws comprehend describe-entities-detection-job \
             --job-id entities-job-id \
             --region aws-region
   ```

   Em que:
   + *entities-job-id*você está salvo `comprehend-job-id` de[Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend](tutorial-search-metadata-entities-analysis.md),
   + *aws-region*é a sua AWS região.

------
#### [ Windows ]

   ```
   aws comprehend describe-entities-detection-job ^
             --job-id entities-job-id ^
             --region aws-region
   ```

   Em que:
   + *entities-job-id*você está salvo `comprehend-job-id` de[Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend](tutorial-search-metadata-entities-analysis.md),
   + *aws-region*é a sua AWS região.

------

1. Do objeto `OutputDataConfig` na descrição do cargo de sua entidade, copie e salve o valor `S3Uri` como `comprehend-S3uri` em um editor de texto.
**nota**  
O `S3Uri` valor tem um formato semelhante *s3://amzn-s3-demo-bucket/.../output/output.tar.gz* a.

1. Para baixar o arquivo de saída das entidades, use o comando [copiar](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html):

------
#### [ Linux ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Em que:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*é o `S3Uri` valor que você salvou como `comprehend-S3uri`
   + *path/*é o diretório local em que você deseja salvar a saída.

------
#### [ macOS ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Em que:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*é o `S3Uri` valor que você salvou como `comprehend-S3uri`
   + *path/*é o diretório local em que você deseja salvar a saída.

------
#### [ Windows ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Em que:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*é o `S3Uri` valor que você salvou como `comprehend-S3uri`
   + *path/*é o diretório local em que você deseja salvar a saída.

------

1. Para extrair a saída das entidades, execute o seguinte comando em uma janela de terminal:

------
#### [ Linux ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Em que:
   + *path/*é o caminho do `output.tar.gz` arquivo baixado em seu dispositivo local.

------
#### [ macOS ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Em que:
   + *path/*é o caminho do `output.tar.gz` arquivo baixado em seu dispositivo local.

------
#### [ Windows ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Em que:
   + *path/*é o caminho do `output.tar.gz` arquivo baixado em seu dispositivo local.

------

Ao final desta etapa, você deve ter um arquivo no dispositivo chamado `output` com uma lista de entidades identificadas pelo Amazon Comprehend.

## Carregando a saída no bucket do S3
<a name="tutorial-search-metadata-format-output-upload"></a>

Depois de baixar e extrair o arquivo de análise de entidades do Amazon Comprehend, carregue o arquivo extraído `output` no bucket do Amazon S3.

### Faça upload de arquivos de saída para o Amazon Comprehend (console)
<a name="tutorial-search-metadata-upload-output-console"></a>

1. Abra o console do Amazon S3 em [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Em **Buckets**, escolha o nome do bucket e, em seguida, escolha **Carregar**.

1. Em **Arquivos e pastas**, escolha **Adicionar arquivos**.

1. Na caixa de diálogo, navegue até o arquivo `output` extraído no dispositivo, selecione-o e escolha **Abrir**.

1. Mantenha as configurações padrão para **Destino**, **Permissões** e **Propriedades**.

1. Escolha **Carregar**.

### Faça upload de arquivos de saída para o Amazon Comprehend (AWS CLI)
<a name="tutorial-search-metadata-upload-output-cli"></a>

1. Para fazer o upload do arquivo extraído `output` para o bucket, use o comando [copiar](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html):

------
#### [ Linux ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o arquivo extraído, `output`
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ macOS ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o arquivo extraído, `output`
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ Windows ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Em que:
   + *path/*é o caminho do arquivo local para o arquivo extraído, `output`
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------

1. Para garantir que o arquivo `output` tenha sido carregado com sucesso no bucket do S3, verifique o conteúdo usando o comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------

## Conversão da saída para o formato de metadados do Amazon Kendra
<a name="tutorial-search-metadata-format-output-script"></a>

Para converter a saída do Amazon Comprehend em metadados do Amazon Kendra, execute um script Python 3. Se você estiver usando o console, use AWS CloudShell para esta etapa.

### Para executar o script Python 3 (Console)
<a name="tutorial-search-metadata-format-output-console"></a>

1. Baixe o arquivo compactado [converter.py.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip) em seu dispositivo.

1. Extraia o arquivo Python 3 `converter.py`.

1. Faça login no [AWS Management Console](https://aws.amazon.com/console/) e certifique-se de que sua AWS região esteja configurada para a mesma região do seu bucket do S3 e do seu trabalho de análise do Amazon Comprehend.

1. Escolha o **AWS CloudShell ícone** ou digite **AWS CloudShell**na caixa **Pesquisar** na barra de navegação superior para iniciar um ambiente.
**nota**  
Quando AWS CloudShell é iniciado em uma nova janela do navegador pela primeira vez, um painel de boas-vindas é exibido e lista os principais recursos. O shell estará pronto para interação após você fechar esse painel e o prompt de comando for exibido.

1. Depois que o terminal estiver preparado, escolha **Ações** no painel de navegação e escolha **Carregar arquivo** no menu.

1. Na caixa de diálogo que se abre, escolha **Selecionar arquivo** e, em seguida, escolha o arquivo Python 3 baixado `converter.py` do dispositivo. Escolha **Carregar**.

1. No AWS CloudShell ambiente, insira o seguinte comando:

   ```
   python3 converter.py
   ```

1. Quando a interface do shell solicitar que você **Insira o nome do bucket do S3**, insira o nome do bucket do S3 e pressione enter.

1. Quando a interface do shell solicitar que você **Insira o caminho completo do arquivo de saída do Comprehend**, digite e pressione enter **output**.

1. Quando a interface do shell solicitar que você **Insira o caminho completo do arquivo de metadados**, digite e pressione enter **metadata/**.

**Importante**  
Para que os metadados sejam formatados corretamente, os valores de entrada nas etapas 8 a 10 devem ser exatos.

### Para executar o script Python 3 (AWS CLI)
<a name="tutorial-search-metadata-format-output-cli"></a>

1. Faça o download do arquivo Python `converter.py`, execute o seguinte comando na janela do terminal:

------
#### [ Linux ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo para o local em que você deseja salvar o arquivo compactado.

------
#### [ macOS ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo para o local em que você deseja salvar o arquivo compactado.

------
#### [ Windows ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Em que:
   + *path/*é o caminho do arquivo para o local em que você deseja salvar o arquivo compactado.

------

1. Para extrair o arquivo Python 3, execute o seguinte comando na janela do terminal:

------
#### [ Linux ]

   ```
   unzip path/converter.py.zip -d path/
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------
#### [ macOS ]

   ```
   unzip path/converter.py.zip -d path/
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------
#### [ Windows ]

   ```
   tar -xf path/converter.py.zip -C path/
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------

1. Certifique-se de que o Boto3 esteja instalado no dispositivo executando o seguinte comando:

------
#### [ Linux ]

   ```
   pip3 show boto3
   ```

------
#### [ macOS ]

   ```
   pip3 show boto3
   ```

------
#### [ Windows ]

   ```
   pip3 show boto3
   ```

------
**nota**  
Se você não tiver o Boto3 instalado, execute `pip3 install boto3` para instalá-lo.

1. Para executar o script Python 3 para converter o `output` arquivo, execute o comando a seguir.

------
#### [ Linux ]

   ```
   python path/converter.py
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------
#### [ macOS ]

   ```
   python path/converter.py
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------
#### [ Windows ]

   ```
   python path/converter.py
   ```

   Em que:
   + *path/*é o caminho do arquivo salvo`converter.py.zip`.

------

1. Quando AWS CLI solicitado`Enter the name of your S3 bucket`, insira o nome do seu bucket do S3 e pressione enter.

1. Quando AWS CLI solicitado`Enter the full filepath to your Comprehend output file`, insira **output** e pressione enter.

1. Quando AWS CLI solicitado`Enter the full filepath to your metadata folder`, insira **metadata/** e pressione enter.

**Importante**  
Para que os metadados sejam formatados corretamente, os valores de entrada nas etapas 5 a 7 devem ser exatos.

No final dessa etapa, os metadados formatados são depositados dentro da pasta `metadata` no bucket do S3.

## Como limpar o bucket do Amazon S3
<a name="tutorial-search-metadata-format-output-cleanup"></a>

Como o índice do Amazon Kendra sincroniza todos os arquivos armazenados em um bucket, recomendamos que você limpe o bucket do Amazon S3 para evitar resultados de pesquisa redundantes.

### Limpe o bucket do Amazon S3 (Console)
<a name="tutorial-search-metadata-cleanup-bucket-console"></a>

1. Abra o console do Amazon S3 em [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Em **Buckets**, escolha o bucket e, em seguida, selecione a pasta de saída da análise de entidades do Amazon Comprehend, o arquivo de análise de entidades `.temp` do Amazon Comprehend e o arquivo `output` extraído do Amazon Comprehend. 

1. Na guia **Visão geral**, escolha **Excluir**.

1. Em **Excluir objetos**, escolha **Excluir objetos permanentemente?** e insira **permanently delete** no campo de entrada de texto.

1. Escolha **Delete objects** (Excluir objetos).

### Como limpar o bucket do Amazon S3 (AWS CLI)
<a name="tutorial-search-metadata-cleanup-bucket-cli"></a>

1. Para excluir todos os arquivos e as pastas no bucket do S3, exceto as pastas `data` e `metadata` use o comando [remover](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/rm.html) no AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ macOS ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ Windows ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------

1. Para garantir que os objetos tenham sido carregados com sucesso no bucket do S3, verifique o conteúdo usando o comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Em que:
   + amzn-s3-demo-bucket é o nome do bucket do S3.

------

Ao final desta etapa, você converteu a saída da análise de entidades do Amazon Comprehend em metadados do Amazon Kendra. Agora, você está pronto para criar um índice do Amazon Kendra.