Etapa 2: executar um trabalho de análise de entidades no Amazon Comprehend
Depois de armazenar o conjunto de dados de amostra no bucket do S3, execute um trabalho de análise de entidades do Amazon Comprehend para extrair entidades dos documentos. Essas entidades formarão atributos personalizados do Amazon Kendra e ajudarão você a filtrar os resultados da pesquisa no índice. Para obter mais informações, consulte Detectar eventos.
executando um trabalho de análise de entidades no Amazon Comprehend
Depois de armazenar o conjunto de dados,, execute um trabalho de análise de entidades do Amazon Comprehend.
Se estiver usando a CLI AWS nesta etapa, primeiro crie e anexe uma função e um perfil do IAM da AWS para o Amazon Comprehend e, em seguida, execute um trabalho de análise de entidades. Para executar um trabalho de análise de entidades dos dados de amostra, o Amazon Comprehend precisa de:
-
um perfil do IAM da AWS Identity and Access Management que a reconhece como uma entidade confiável
-
uma política do IAM da AWS que tenha permissões suficientes para acessar o bucket do S3.
Para obter mais informações, consulte Como o Amazon Comprehend funciona com o IAM e Políticas baseadas em identidade para o Amazon Comprehend.
Abra o console do Amazon Comprehend em https://console.aws.amazon.com/comprehend/
. Importante
Certifique-se de que você esteja na mesma região em que você criou o bucket do Amazon S3. Se estiver em outra região, escolha a região da AWS na qual você criou o bucket do S3 no Seletor de Regiões na barra de navegação na parte superior.
-
Escolha Executar o Amazon Comprehend).
-
No painel de navegação à esquerda, escolha Trabalhos de análise.
-
Escolha Criar trabalho.
-
Na seção Configurações de trabalho, faça o seguinte:
-
Em Nome, insira
data-entities-analysis. -
Em Tipo de análise, escolha Entidades.
-
Em Idioma, escolha Inglês.
-
Mantenha a Criptografia do trabalho desativada.
-
-
Na seção Dados de entrada, faça o seguinte:
-
Em Fonte de dados, escolha Meus documentos.
-
Para a Localização do S3, escolha Procurar no S3.
-
Em Escolher recursos, clique no nome do bucket na lista de buckets.
-
Em Objetos, selecione o botão de opção para
datae escolha Escolher. -
Em Formato de entrada, escolha Um documento por linha.
-
-
Na seção Dados de saída, faça o seguinte:
-
Para a Localização do S3, escolha Procurar no S3 e, em seguida, escolha a caixa de opção para o bucket na lista de buckets e escolha Escolher.
-
Mantenha a Criptografia desativada.
-
-
Na seção Permissões de acesso, faça o seguinte:
-
Em Perfil do IAM), escolha Criar um perfil do IAM).
-
Em Permissões para acessar, escolha Buckets do S3 de entrada e saída.
-
Em Sufixo do nome, insira
comprehend-role. Esse perfil fornece acesso ao bucket do Amazon S3.
-
-
Mantenha a Configuração da VPC padrão.
-
Escolha Criar trabalho.
-
Para criar e anexar um perfil do IAM para a Amazon Comprehend que a reconheça como uma entidade confiável, faça o seguinte:
-
Salve a política de confiança a seguir como um arquivo JSON chamado
comprehend-trust-policy.jsonem um editor ou texto em seu computador. -
Para criar um perfil do IAM chamado
comprehend-rolee anexar o arquivocomprehend-trust-policy.jsonsalvo para ele, use o comando create-role: -
Copie o nome do recurso da Amazon (ARN) no editor de texto e salve-o localmente como
comprehend-role-arn.nota
O ARN tem um formato semelhante a
arn:aws:iam::123456789012:role/comprehend-role. Você precisa do ARN no qual você salvoucomprehend-role-arnpara executar o trabalho de análise do Amazon Comprehend.
-
-
Para criar e anexar uma política do IAM ao seu perfil do IAM do IAM que conceda permissões para acessar seu bucket do S3, faça o seguinte:
-
Salve a política de confiança a seguir como um arquivo JSON chamado
comprehend-S3-access-policy.jsonem um editor ou texto em seu computador. -
Para criar uma política do IAM chamada
comprehend-S3-access-policypara acessar o bucket do S3, use o comando create-policy: -
Copie o nome do recurso da Amazon (ARN) no editor de texto e salve-o localmente como
comprehend-S3-access-arn.nota
O ARN tem um formato semelhante a
arn:aws:iam::123456789012:role/comprehend-S3-access-policy. Você precisa do ARN em que salvoucomprehend-S3-access-arnpara anexarcomprehend-S3-access-policyao perfil do IAM. -
Use o comando attach-role-policy
para anexar comprehend-S3-access-policyao perfil do IAM:
-
-
-
Copie a análise das entidades
JobIde salve-a em um editor de texto comocomprehend-job-id.JobIdajuda a rastrear o status do trabalho de análise de entidades. -
Para acompanhar o progresso do trabalho de análise de entidades, use o comando describe-entities-detection-job
:
Pode levar vários minutos para que JobStatus seja alterado para COMPLETED.
Ao final dessa etapa, o Amazon Comprehend armazena os resultados da análise de entidades como um arquivo output.tar.gz compactado dentro de uma pasta dentro de output uma pasta gerada automaticamente no bucket do S3. O status do trabalho de análise deve estar concluído antes de passar para a próxima etapa.