

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Sincronizar os dados com a base de conhecimento do Amazon Bedrock
<a name="kb-data-source-sync-ingest"></a>

Depois de criar a base de conhecimento, ingira ou sincronize os dados para que eles possam ser consultados. A ingestão converte os dados brutos na fonte de dados em incorporações de vetores, com base no modelo de incorporação de vetores e nas configurações especificadas.

Antes de começar a ingestão, verifique se a fonte de dados atende às seguintes condições:
+ Você configurou as informações de conexão da fonte de dados. Para configurar um conector de fonte de dados para rastrear os dados do repositório da fonte de dados, consulte [Conectores compatíveis de fonte de dados](https://docs.aws.amazon.com/bedrock/latest/userguide/data-source-connectors.html). Você configura a fonte de dados como parte criação da base de conhecimento.
+ Você configurou o modelo de incorporação de vetores e o armazenamento de vetores escolhidos. Consulte os [modelos de incorporação de vetores compatíveis](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-supported.html) e os [armazenamentos de vetores de base de conhecimento](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-setup.html). Você configura as incorporações de vetores como parte da criação da base de conhecimento.
+ Os arquivos estão nos formatos compatíveis. Para obter mais informações, consulte [Formatos de documento compatíveis](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ Os arquivos não excedem o **tamanho do arquivo de trabalho de ingestão** especificado em [Amazon Bedrock endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/bedrock.html) no Referência geral da AWS.
+ Se a fonte de dados contiver arquivos de metadados, verifique as seguintes condições para garantir que os arquivos de metadados não sejam ignorados:
  + Cada arquivo `.metadata.json` compartilha o mesmo nome e extensão do arquivo de origem ao qual está associado.
  + Se o índice de vetores da base de conhecimento estiver em um armazenamento de vetores do Amazon OpenSearch Sem Servidor, verifique se o índice de vetores está configurado com o mecanismo `faiss`. Se o índice de vetores estiver configurado com o mecanismo `nmslib`, será necessário fazer o seguinte:
    + [Criar uma base de conhecimento](knowledge-base-create.md) no console e permitir que o Amazon Bedrock crie automaticamente um índice de vetores no Amazon OpenSearch Sem Servidor para você.
    + [Criar outro índice de vetores](knowledge-base-setup.md) no armazenamento de vetores e selecionar `faiss` como o **mecanismo**. Em seguida, [criar uma base de conhecimento](knowledge-base-create.md) e especificar o novo índice de vetores.
  + Se o índice de vetores da base de conhecimento estiver em um cluster de banco de dados do Amazon Aurora, recomendamos que você use o campo de metadados personalizados para armazenar todos os metadados em uma única coluna e criar um índice nessa coluna. Se você não fornecer o campo de metadados personalizados, verifique se a tabela do índice contém uma coluna para cada propriedade de metadados nos arquivos de metadados antes de iniciar a ingestão. Para obter mais informações, consulte [Pré-requisitos para usar o armazenamento de vetores que você criou para uma base de conhecimento](knowledge-base-setup.md).

Sempre que você adicionar, modificar ou remover arquivos da fonte de dados, sincronize a fonte de dados para que ela seja reindexada na base de conhecimento. A sincronização é incremental, portanto, o Amazon Bedrock processa somente documentos adicionados, modificados ou excluídos desde a última sincronização.

Para saber como ingerir dados na base de conhecimento e sincronizar com os dados mais recentes, escolha a guia correspondente ao método de sua preferência e siga as etapas:

------
#### [ Console ]

**Saiba como ingerir dados na base de conhecimento e sincronizar com os dados mais recentes.**

1. Abra o console do Amazon Bedrock em [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. No painel de navegação à esquerda, selecione **Base de conhecimento** e escolha a base de conhecimento.

1. Na seção **Fonte de dados**, selecione **Sincronizar** para iniciar a ingestão de dados ou a sincronização dos dados mais recentes. Para interromper a sincronização de uma fonte de dados em andamento, selecione **Parar**. Uma fonte de dados deve estar em sincronização para que a sincronização da fonte de dados seja interrompida. É possível selecionar **Sincronizar** novamente para ingerir o resto dos dados.

1. Quando a ingestão de dados for concluída, um banner verde de sucesso será exibido se ela tiver sido bem-sucedida.
**nota**  
Após a conclusão da sincronização de dados, pode levar alguns minutos para que as incorporações dos dados recém-sincronizados sejam refletidas na base de conhecimento e estejam disponíveis para consulta se você usar um armazenamento de vetores diferente do Amazon Aurora (RDS).

1. É possível escolher uma fonte de dados para visualizar o **Histórico de sincronização**. Selecione **Visualizar avisos** para ver por que um trabalho de ingestão de dados falhou.

------
#### [ API ]

Para ingerir os dados na base de conhecimento e sincronizar com os dados mais recentes, envie uma solicitação [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html) com um [endpoint de tempo de compilação do Agentes para Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Especifique o `knowledgeBaseId` e o `dataSourceId`. Você também pode interromper um trabalho de ingestão de dados em execução enviando uma solicitação [StopIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html). Especifique o `dataSourceId`, o `ingestionJobId` e o `knowledgeBaseId`. Um trabalho de ingestão de dados deve estar em execução para interromper a ingestão de dados. É possível enviar uma solicitação `StartIngestionJob` novamente para ingerir o resto dos seus dados quando tudo estiver pronto.

Use o `ingestionJobId` exibido na resposta em uma solicitação [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html) com um [endpoint de tempo de compilação do Agentes para Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt) para rastrear o status do trabalho de ingestão. Além disso, especifique o `knowledgeBaseId` e o `dataSourceId`.
+ Quando o trabalho de ingestão for concluído, o `status` na resposta será `COMPLETE`.
**nota**  
Após a conclusão da ingestão de dados, pode levar alguns minutos para que as incorporações de vetores dos dados recém-ingeridos estejam disponíveis no armazenamento de vetores para consulta, se você usar um armazenamento de vetores diferente do Amazon Aurora (RDS).
+ O objeto `statistics` na resposta retorna informações sobre se a ingestão foi bem-sucedida ou não para documentos na fonte de dados.

Você também pode ver as informações de todos os trabalhos de ingestão de uma fonte de dados enviando uma solicitação [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html) com um [endpoint de tempo de compilação do Agentes para Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt). Especifique o `dataSourceId` e o `knowledgeBaseId` da base de conhecimento na qual os dados estão sendo ingeridos.
+ Filtre os resultados especificando um status a ser pesquisado no objeto `filters`.
+ Classifique pela hora em que o trabalho foi iniciado ou pelo status de um trabalho, especificando o objeto `sortBy`. É possível classificar em ordem crescente ou decrescente.
+ Defina o número máximo de resultados a serem retornados em uma resposta no campo `maxResults`. Se houver mais resultados do que o número definido, a resposta retornará um `nextToken` que você poderá enviar em outra solicitação [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html) para ver o próximo lote de trabalhos.

------