Como adicionar documentos diretamente a um índice com o upload em lote.
Você pode excluir documentos diretamente de um índice usando a API BatchPutDocument. Você não pode excluir documentos diretamente usando o console. Se você usa o console, você se conecta a uma fonte de dados para adicionar documentos ao seu índice. Os documentos podem ser adicionados de um bucket do S3 ou fornecidos como dados binários. Consulte uma lista dos tipos de documentos compatíveis com o Amazon Kendra em Tipos de documentos.
A adição de documentos a um índice usando BatchPutDocument é uma operação assíncrona. Depois de chamar a API BatchPutDocument, use API BatchGetDocumentStatus para monitorar o progresso de indexar os documentos. Quando você chama a API BatchGetDocumentStatus com uma lista de IDs de documentos, ela retorna o status do documento. Quando o status do documento é INDEXED ou FAILED, o processamento do documento está concluído. Quando o status é FAILED, a API BatchGetDocumentStatus retorna o motivo pelo qual o documento não pôde ser indexado.
Se você quiser alterar os metadados ou os atributos e o conteúdo do documento durante o processo de absorção do documento, consulte Enriquecimento personalizado de documentos no Amazon Kendra. Se você quiser usar uma fonte de dados personalizada, cada documento enviado usando a API BatchPutDocument exige uma ID da fonte de dados e uma ID de execução como atributos ou campos. Para obter mais informações, consulte Atributos obrigatórios para fontes de dados personalizadas.
nota
Cada ID de documento deve ser exclusivo por índice. Você não pode criar uma fonte de dados para indexar os documentos com os IDs exclusivos e depois usar a API BatchPutDocument para indexar os mesmos documentos ou vice-versa. Você pode criar uma fonte de dados e depois usar a API BatchPutDocument para indexar os mesmos documentos ou vice-versa. Usar as APIs BatchPutDocument e BatchDeleteDocument em combinação com um conector de fonte de dados do Amazon Kendra para o mesmo conjunto de documentos pode causar inconsistências entre os dados. Em vez disso, recomendamos usar o conector de fonte de dados personalizado do Amazon Kendra.
Os seguintes documentos do guia do desenvolvedor mostram como adicionar documentos diretamente a um índice:
Adicionar documentos com a API BatchputDocument
O exemplo a seguir adiciona um blob de texto a um índice chamando BatchputDocument. É possível usar a API BatchPutDocument para adicionar documentos diretamente ao índice. Consulte uma lista dos tipos de documentos compatíveis com o Amazon Kendra em Tipos de documentos.
Para ver um exemplo de criação de um índice usando os SDKs e AWS CLI, consulte Criação de um índice. Para configurar a CLI e os SDKs, consulte Configurando Amazon Kendra.
nota
Os arquivos adicionados ao índice devem estar em um fluxo de bytes codificado UTF-8.
Nos exemplos a seguir, o texto codificado em UTF-8 é adicionado ao índice.
Adicionar documentos de um bucket do S3
É possível adicionar documentos diretamente ao índice de um bucket do Amazon S3 usando a API BatchPutDocument. Você pode inserir até 10 documentos na mesma chamada. Ao usar um bucket do S3, você deve fornecer uma função do IAM com permissão para acessar o bucket que contém seus documentos. Você especifica a função com o parâmetro RoleArn.
Usar a API BatchputDocument para adicionar documentos de um bucket do Amazon S3 é uma operação única. Para manter um índice sincronizado com o conteúdo de um bucket, crie uma fonte de dados do Amazon S3. Para obter mais informações, consulte fonte de dados do Amazon S3.
Para ver um exemplo de criação de um índice usando os SDKs e AWS CLI, consulte Criação de um índice. Para configurar a CLI e os SDKs, consulte Configurando Amazon Kendra. Para obter informações sobre como criar um bucket do S3, consulte a documentação do Amazon Simple Storage Service.
No exemplo a seguir, dois documentos do Microsoft Word são adicionados ao índice usando a API BatchPutDocument.