As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend
Depois de armazenar o conjunto de dados de amostra no bucket do S3, execute um trabalho de análise de entidades do Amazon Comprehend para extrair entidades dos documentos. Essas entidades formarão atributos personalizados do Amazon Kendra e ajudarão você a filtrar os resultados da pesquisa no índice. Para obter mais informações, consulte Detectar eventos.
executando um trabalho de análise de entidades no Amazon Comprehend
Depois de armazenar o conjunto de dados,, execute um trabalho de análise de entidades do Amazon Comprehend.
Se você estiver usando a AWS CLI nesta etapa, primeiro crie e anexe uma função e uma política AWS do IAM para o Amazon Comprehend e, em seguida, execute um trabalho de análise de entidades. Para executar um trabalho de análise de entidades dos dados de amostra, o Amazon Comprehend precisa de:
-
uma função AWS Identity and Access Management (IAM) que a reconhece como uma entidade confiável
-
uma política AWS do IAM anexada à função do IAM que lhe dá permissões para acessar seu bucket do S3
Para obter mais informações, consulte Como o Amazon Comprehend funciona com o IAM e Políticas baseadas em identidade para o Amazon Comprehend.
Abra o console do Amazon Comprehend em. https://console.aws.amazon.com/comprehend/
Importante
Certifique-se de que você esteja na mesma região em que você criou o bucket do Amazon S3. Se você estiver em outra região, escolha a AWS região em que criou seu bucket do S3 no seletor de regiões na barra de navegação superior.
-
Escolha Executar o Amazon Comprehend).
-
No painel de navegação à esquerda, escolha Trabalhos de análise.
-
Escolha Criar trabalho.
-
Na seção Configurações de trabalho, faça o seguinte:
-
Em Nome, insira
data-entities-analysis
. -
Em Tipo de análise, escolha Entidades.
-
Em Idioma, escolha Inglês.
-
Mantenha a Criptografia do trabalho desativada.
-
-
Na seção Dados de entrada, faça o seguinte:
-
Em Fonte de dados, escolha Meus documentos.
-
Para a Localização do S3, escolha Procurar no S3.
-
Em Escolher recursos, clique no nome do bucket na lista de buckets.
-
Em Objetos, selecione o botão de opção para
data
e escolha Escolher. -
Em Formato de entrada, escolha Um documento por linha.
-
-
Na seção Dados de saída, faça o seguinte:
-
Para a Localização do S3, escolha Procurar no S3 e, em seguida, escolha a caixa de opção para o bucket na lista de buckets e escolha Escolher.
-
Mantenha a Criptografia desativada.
-
-
Na seção Permissões de acesso, faça o seguinte:
-
Em Perfil do IAM), escolha Criar um perfil do IAM).
-
Em Permissões para acessar, escolha Buckets do S3 de entrada e saída.
-
Em Sufixo do nome, insira
comprehend-role
. Esse perfil fornece acesso ao bucket do Amazon S3.
-
-
Mantenha a Configuração da VPC padrão.
-
Escolha Criar trabalho.
-
Para criar e anexar um perfil do IAM para a Amazon Comprehend que a reconheça como uma entidade confiável, faça o seguinte:
-
Salve a política de confiança a seguir como um arquivo JSON chamado
comprehend-trust-policy.json
em um editor ou texto em seu computador. -
Para criar um perfil do IAM chamado
comprehend-role
e anexar o arquivocomprehend-trust-policy.json
salvo para ele, use o comando create-role: -
Copie o nome do recurso da Amazon (ARN) no editor de texto e salve-o localmente como
comprehend-role-arn
.nota
O ARN tem um formato semelhante a
arn:aws:iam::123456789012:role/comprehend-role
. Você precisa do ARN no qual você salvoucomprehend-role-arn
para executar o trabalho de análise do Amazon Comprehend.
-
-
Para criar e anexar uma política do IAM ao seu perfil do IAM do IAM que conceda permissões para acessar seu bucket do S3, faça o seguinte:
-
Salve a política de confiança a seguir como um arquivo JSON chamado
comprehend-S3-access-policy.json
em um editor ou texto em seu computador. -
Para criar uma política do IAM chamada
comprehend-S3-access-policy
para acessar o bucket do S3, use o comando create-policy: -
Copie o nome do recurso da Amazon (ARN) no editor de texto e salve-o localmente como
comprehend-S3-access-arn
.nota
O ARN tem um formato semelhante a
arn:aws:iam::123456789012:role/comprehend-S3-access-policy
. Você precisa do ARN em que salvoucomprehend-S3-access-arn
para anexarcomprehend-S3-access-policy
ao perfil do IAM. -
Para anexar o
comprehend-S3-access-policy
à sua função do IAM, use o attach-role-policycomando:
-
-
Para executar um trabalho de análise de entidades do Amazon Comprehend, use o comando: start-entities-detection-job
-
Copie a análise das entidades
JobId
e salve-a em um editor de texto comocomprehend-job-id
.JobId
ajuda a rastrear o status do trabalho de análise de entidades. -
Para acompanhar o progresso do seu trabalho de análise de entidades, use o describe-entities-detection-job
comando:
Pode levar vários minutos para que JobStatus
seja alterado para COMPLETED
.
Ao final dessa etapa, o Amazon Comprehend armazena os resultados da análise de entidades como um arquivo output.tar.gz
compactado dentro de uma pasta dentro de output
uma pasta gerada automaticamente no bucket do S3. O status do trabalho de análise deve estar concluído antes de passar para a próxima etapa.