As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Etapa 3: formatar a saída da análise de entidades como metadados do Amazon Kendra
Para converter as entidades extraídas pelo Amazon Comprehend para o formato de metadados exigido por um índice do Amazon Kendra, execute um script Python 3. Os resultados da conversão são armazenados na pasta metadata
do bucket da Amazon S3.
Para obter mais informações sobre o formato e a estrutura dos metadados do Amazon Kendra, consulte Metadados do documento do S3.
Tópicos
Baixando e extraindo a saída do Amazon Comprehend
Para formatar a saída da análise de entidades do Amazon Comprehend, você deve primeiro baixar o arquivo de análise de entidades do Amazon Comprehend do output.tar.gz
e extrair o arquivo de análise de entidades.
-
No console do Amazon Comprehend, no painel de navegação, acesse às Tarefas de análise..
-
Escolha sua tarefa de análise de entidades
data-entities-analysis
. -
Em Saída, escolha o link exibido ao lado do Local dos dados de saída. Isso redireciona você para o arquivo de
output.tar.gz
em seu bucket do S3. -
Na página Visão geral selecione Fazer download.
dica
A saída de todos os trabalhos de análise do Amazon Comprehend tem o mesmo nome. Renomear p arquivo ajudará você a rastreá-lo com mais facilidade.
-
Descompacte e extraia o arquivo do Amazon Comprehend baixado para o seu dispositivo.
-
Para acessar o nome da pasta gerada automaticamente pelo Amazon Comprehend em seu bucket do S3 que contém os resultados do trabalho de análise de entidades, use o comando: describe-entities-detection-job
-
Do objeto
OutputDataConfig
na descrição do cargo de sua entidade, copie e salve o valorS3Uri
comocomprehend-S3uri
em um editor de texto.nota
O
S3Uri
valor tem um formato semelhantes3://amzn-s3-demo-bucket/.../output/output.tar.gz
a. -
Para baixar o arquivo de saída das entidades, use o comando copiar
: -
Para extrair a saída das entidades, execute o seguinte comando em uma janela de terminal:
Ao final desta etapa, você deve ter um arquivo no dispositivo chamado output
com uma lista de entidades identificadas pelo Amazon Comprehend.
Carregando a saída no bucket do S3
Depois de baixar e extrair o arquivo de análise de entidades do Amazon Comprehend, carregue o arquivo extraído output
no bucket do Amazon S3.
Abra o console do Amazon S3 em https://console.aws.amazon.com/s3/
. -
Em Buckets, escolha o nome do bucket e, em seguida, escolha Carregar.
-
Em Arquivos e pastas, escolha Adicionar arquivos.
-
Na caixa de diálogo, navegue até o arquivo
output
extraído no dispositivo, selecione-o e escolha Abrir. -
Mantenha as configurações padrão para Destino, Permissões e Propriedades.
-
Escolha Carregar.
Conversão da saída para o formato de metadados do Amazon Kendra
Para converter a saída do Amazon Comprehend em metadados do Amazon Kendra, execute um script Python 3. Se você estiver usando o console, use AWS CloudShell para esta etapa.
-
Baixe o arquivo compactado converter.py.zip em seu dispositivo.
-
Extraia o arquivo Python 3
converter.py
. -
Faça login no AWS Management Console
e certifique-se de que sua AWS região esteja configurada para a mesma região do bucket do S3 e do trabalho de análise do Amazon Comprehend. -
Escolha o AWS CloudShell ícone ou digite AWS CloudShellna caixa Pesquisar na barra de navegação superior para iniciar um ambiente.
nota
Quando AWS CloudShell é iniciado em uma nova janela do navegador pela primeira vez, um painel de boas-vindas é exibido e lista os principais recursos. O shell estará pronto para interação após você fechar esse painel e o prompt de comando for exibido.
-
Depois que o terminal estiver preparado, escolha Ações no painel de navegação e escolha Carregar arquivo no menu.
-
Na caixa de diálogo que se abre, escolha Selecionar arquivo e, em seguida, escolha o arquivo Python 3 baixado
converter.py
do dispositivo. Escolha Carregar. -
No AWS CloudShell ambiente, digite o seguinte comando:
python3 converter.py
-
Quando a interface do shell solicitar que você Insira o nome do bucket do S3, insira o nome do bucket do S3 e pressione enter.
-
Quando a interface do shell solicitar que você Insira o caminho completo do arquivo de saída do Comprehend, digite e pressione enter
output
. -
Quando a interface do shell solicitar que você Insira o caminho completo do arquivo de metadados, digite e pressione enter
metadata/
.
Importante
Para que os metadados sejam formatados corretamente, os valores de entrada nas etapas 8 a 10 devem ser exatos.
-
Faça o download do arquivo Python
converter.py
, execute o seguinte comando na janela do terminal: -
Para extrair o arquivo Python 3, execute o seguinte comando na janela do terminal:
-
Certifique-se de que o Boto3 esteja instalado no dispositivo executando o seguinte comando:
nota
Se você não tiver o Boto3 instalado, execute
pip3 install boto3
para instalá-lo. -
Para executar o script Python 3 para converter o
output
arquivo, execute o comando a seguir. -
Quando AWS CLI solicitado
Enter the name of your S3 bucket
, insira o nome do seu bucket do S3 e pressione enter. -
Quando AWS CLI solicitado
Enter the full filepath to your Comprehend output file
, insiraoutput
e pressione enter. -
Quando AWS CLI solicitado
Enter the full filepath to your metadata folder
, insirametadata/
e pressione enter.
Importante
Para que os metadados sejam formatados corretamente, os valores de entrada nas etapas 5 a 7 devem ser exatos.
No final dessa etapa, os metadados formatados são depositados dentro da pasta metadata
no bucket do S3.
Como limpar o bucket do Amazon S3
Como o índice do Amazon Kendra sincroniza todos os arquivos armazenados em um bucket, recomendamos que você limpe o bucket do Amazon S3 para evitar resultados de pesquisa redundantes.
Abra o console do Amazon S3 em https://console.aws.amazon.com/s3/
. -
Em Buckets, escolha o bucket e, em seguida, selecione a pasta de saída da análise de entidades do Amazon Comprehend, o arquivo de análise de entidades
.temp
do Amazon Comprehend e o arquivooutput
extraído do Amazon Comprehend. -
Na guia Visão geral, escolha Excluir.
-
Em Excluir objetos, escolha Excluir objetos permanentemente? e insira
permanently delete
no campo de entrada de texto. -
Escolha Delete objects (Excluir objetos).
Ao final desta etapa, você converteu a saída da análise de entidades do Amazon Comprehend em metadados do Amazon Kendra. Agora, você está pronto para criar um índice do Amazon Kendra.