

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Tutorial: criando uma solução de pesquisa inteligente e enriquecida com metadados com o Amazon Kendra
<a name="tutorial-search-metadata"></a>

[Este tutorial mostra como criar uma solução de pesquisa inteligente enriquecida com metadados, baseada em linguagem natural, para os dados corporativos usando o Amazon Kendra[, o Amazon Comprehend, o Amazon Simple](https://aws.amazon.com/kendra/) Storage Service ([S3) e. [AWS CloudShell](https://aws.amazon.com/cloudshell/)](https://aws.amazon.com/comprehend/)](https://aws.amazon.com/s3/)

O Amazon Kendra é um serviço de pesquisa inteligente que pode criar um índice de pesquisa para seus repositórios de dados não estruturados em linguagem natural. Para facilitar que o clientes encontrem e filtrem respostas relevantes, use o Amazon Comprehend para extrair metadados dosdados e inseri-los no índice de pesquisa do Amazon Kendra.

O Amazon Comprehend é um serviço gerenciado de processamento de linguagem natural (PLN) capaz de identificar entidades. Entidades são referências a pessoas, lugares, locais, organizações e objetos nos dados.

Este tutorial usa um conjunto de dados de amostra de artigos de notícias para extrair entidades, convertê-las em metadados e inseri-las no índice do Amazon Kendra para realizar pesquisas. Os metadados adicionados permitem filtrar os resultados da pesquisa usando qualquer subconjunto dessas entidades e melhoram a precisão da pesquisa. Ao seguir este tutorial, você aprenderá como criar uma solução de pesquisa para seus dados corporativos sem nenhum conhecimento especializado em machine learning.

**Este tutorial mostra como criar sua solução de pesquisa usando as seguintes etapas:**

1. Armazenar um conjunto de dados de amostra de artigos de notícias no Amazon S3.

1. Usar o Amazon Comprehend para extrair entidades dos dados.

1. Executar um script Python 3 para converter as entidades no formato de metadados do índice Amazon Kendra e armazenar esses metadados no S3.

1. Criar um índice de pesquisa do Amazon Kendra e ingerir os dados e os metadados.

1. O índice de pesquisa da consulta.

**O diagrama mostra o seguinte fluxo de trabalho:**

![Diagrama do fluxo de trabalho dos procedimentos do tutorial.](http://docs.aws.amazon.com/pt_br/kendra/latest/dg/images/tutorial-workflow.png)


**Tempo estimado para concluir este tutorial:** 1 hora

**Custo estimado:** algumas das ações deste tutorial geram cobranças em sua AWS conta. [Para obter mais informações sobre o custo de cada serviço, consulte as páginas de preços do [Amazon S3](https://aws.amazon.com/s3/pricing/), do Amazon [Comprehend e do Amazon Kendra [AWS CloudShell](https://aws.amazon.com/cloudshell/pricing/)](https://aws.amazon.com/comprehend/pricing/).](https://aws.amazon.com/kendra/pricing/)

**Topics**
+ [Pré-requisitos](#tutorial-search-metadata-prereqs)
+ [Etapa 1: adicionando documentos ao Amazon S3](tutorial-search-metadata-add-documents.md)
+ [Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend](tutorial-search-metadata-entities-analysis.md)
+ [Etapa 3: formatar a saída da análise de entidades como metadados do Amazon Kendra](tutorial-search-metadata-format-output.md)
+ [Etapa 4: criar um índice de pesquisa do Amazon Kendra e ingerir os metadados.](tutorial-search-metadata-create-index-ingest.md)
+ [Etapa 5: consultar o índice do Amazon Kendra](tutorial-search-metadata-query-kendra.md)
+ [Etapa 5: limpar](tutorial-search-metadata-cleanup.md)

## Pré-requisitos
<a name="tutorial-search-metadata-prereqs"></a>

Para concluir este tutorial, você precisará dos seguintes recursos:
+ Uma AWS conta. Se você não tiver uma AWS conta, siga as etapas em [Configurar o Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/setup.html#aws-kendra-set-up-aws-account) para configurar sua conta. AWS 
+ Um computador de desenvolvimento que executa Windows, macOS, Linux ou Unix para acessar o console de gerenciamento da AWS . Para obter mais informações, consulte [Configurando o console AWS de gerenciamento](https://docs.aws.amazon.com/awsconsolehelpdocs/latest/gsg/working-with-console.html).
+ Um usuário do IAM [AWS Identity and Access Management](https://aws.amazon.com/iam/) Para saber como configurar usuários e grupos para sua conta, consulte o tutorial de [Conceitos básicos](https://docs.aws.amazon.com/IAM/latest/UserGuide/getting-started.html) no *Guia do usuário do IAM*.

  Se você estiver usando o AWS Command Line Interface, também precisará anexar a política a seguir ao seu usuário do IAM para conceder a ele as permissões básicas necessárias para concluir este tutorial.

  

  

### (AWS CLI somente) Política de permissões do IAM
<a name="permissions-policy"></a>

------
#### [ JSON ]

****  

  ```
  {
    "Version":"2012-10-17",		 	 	 
    "Statement": [
      {
        "Effect": "Allow",
        "Action": [
          "iam:GetUserPolicy",
          "iam:DeletePolicy",
          "iam:CreateRole",
          "iam:AttachRolePolicy",
          "iam:DetachRolePolicy",
          "iam:AttachUserPolicy",
          "iam:DeleteRole",
          "iam:CreatePolicy",
          "iam:GetRolePolicy",
          "s3:CreateBucket",
          "s3:ListBucket",
          "s3:DeleteObject",
          "s3:DeleteBucket",
          "s3:PutObject",
          "s3:GetObject",
          "s3:ListAllMyBuckets",
          "comprehend:StartEntitiesDetectionJob",
          "comprehend:BatchDetectEntities",
          "comprehend:ListEntitiesDetectionJobs",
          "comprehend:DescribeEntitiesDetectionJob",
          "comprehend:StopEntitiesDetectionJob",
          "comprehend:DetectEntities",
          "kendra:Query",
          "kendra:StopDataSourceSyncJob",
          "kendra:CreateDataSource",
          "kendra:BatchPutDocument",
          "kendra:DeleteIndex",
          "kendra:StartDataSourceSyncJob",
          "kendra:CreateIndex",
          "kendra:ListDataSources",
          "kendra:UpdateIndex",
          "kendra:DescribeIndex",
          "kendra:DeleteDataSource",
          "kendra:ListIndices",
          "kendra:ListDataSourceSyncJobs",
          "kendra:DescribeDataSource",
          "kendra:BatchDeleteDocument"
        ],
        "Resource": "*"
      },
      {
        "Sid": "iamPassRole",
        "Effect": "Allow",
        "Action": "iam:PassRole",
        "Resource": "*",
        "Condition": {
          "StringEquals": {
            "iam:PassedToService": [
              "s3.amazonaws.com",
              "comprehend.amazonaws.com",
              "kendra.amazonaws.com"
            ]
          }
        }
      }
    ]
  }
  ```

------

  Para obter mais informações, consulte [Criar políticas do IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_create.html) em [Adicionar e remover permissões de identidade do IAM.](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies_manage-attach-detach.html).
+ A [Lista de serviços regionais da AWS](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/). Para reduzir a latência, escolha a região AWS mais próxima da sua localização geográfica que seja compatível com o Amazon Comprehend e o Amazon Kendra.
+ (Opcional) Um [AWS Key Management Service](https://docs.aws.amazon.com/kms/latest/developerguide/overview.html). Embora este tutorial não use criptografia, talvez você queira usar as melhores práticas de criptografia para o caso de uso específico.
+ (Opcional) Uma [Amazon Virtual Private Cloud](https://docs.aws.amazon.com/vpc/latest/userguide/what-is-amazon-vpc.html). Embora este tutorial não use VCP, talvez você queira usar as melhores práticas de VCP para garantir a segurança dos dados do caso de uso específico.