Modificar uma fonte de dados da base de conhecimento do Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Modificar uma fonte de dados da base de conhecimento do Amazon Bedrock

É possível atualizar uma fonte de dados da base de dados, como alterar as configurações da fonte de dados.

É possível atualizar uma fonte de dados das seguintes maneiras:

  • Adicionar, alterar ou remover arquivos ou conteúdo da fonte de dados.

  • Alterar as configurações da fonte de dados ou a chave do KMS a ser usada para criptografar dados transitórios durante a ingestão de dados. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável).

  • Defina a política de exclusão de fonte de dados como “Excluir” ou “Reter”. É possível excluir todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. É possível reter todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

Sempre que você adicionar, modificar ou remover arquivos da fonte de dados, sincronize a fonte de dados para que ela seja reindexada na base de conhecimento. A sincronização é incremental, portanto, o Amazon Bedrock processa somente documentos adicionados, modificados ou excluídos desde a última sincronização. Antes de começar a ingestão, verifique se a fonte de dados atende às seguintes condições:

  • Os arquivos estão nos formatos compatíveis. Para obter mais informações, consulte Formatos de documento compatíveis.

  • Os arquivos não excedem o tamanho do arquivo de trabalho de ingestão especificado em Amazon Bedrock endpoints and quotas no Referência geral da AWS.

  • Se a fonte de dados contiver arquivos de metadados, verifique as seguintes condições para garantir que os arquivos de metadados não sejam ignorados:

    • Cada arquivo .metadata.json compartilha o mesmo nome e extensão do arquivo de origem ao qual está associado.

    • Se o índice de vetores da base de conhecimento estiver em um armazenamento de vetores do Amazon OpenSearch Sem Servidor, verifique se o índice de vetores está configurado com o mecanismo faiss. Se o índice de vetores estiver configurado com o mecanismo nmslib, será necessário fazer o seguinte:

    • Se o índice de vetores da base de conhecimento estiver em um cluster de banco de dados do Amazon Aurora, recomendamos que você use o campo de metadados personalizados para armazenar todos os metadados em uma única coluna e criar um índice nessa coluna. Se você não fornecer o campo de metadados personalizados, verifique se a tabela do índice contém uma coluna para cada propriedade de metadados nos arquivos de metadados antes de iniciar a ingestão. Para obter mais informações, consulte Pré-requisitos para usar o armazenamento de vetores que você criou para uma base de conhecimento.

Para saber como atualizar uma fonte de dados, escolha a guia correspondente ao método de sua preferência e siga as etapas:

Console
Como atualizar uma fonte de dados
  1. Faça login no AWS Management Console com uma identidade do IAM que tenha permissões para usar o console do Amazon Bedrock. Em seguida, abra o console do Amazon Bedrock em https://console.aws.amazon.com/bedrock/.

  2. No painel de navegação à esquerda, selecione Bases de conhecimento.

  3. Selecione o nome da base de conhecimento.

  4. Na seção Fonte de dados, selecione o botão de opção ao lado da fonte de dados que deseja editar ou sincronizar.

  5. (Opcional) Escolha Editar, altere as configurações e selecione Enviar. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável). Além disso, observe que não é possível alterar as configurações de fragmentação baseadas nos dados originais ingeridos. Recrie a fonte de dados.

    nota

    Não é possível alterar as configurações de fragmentação. Recrie a fonte de dados.

  6. (Opcional) Escolha editar a política de exclusão de dados da fonte de dados como parte das configurações avançadas:

    Para configurações da política de exclusão de dados, você pode escolher uma das seguintes opções:

    • Excluir: exclui todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou de recurso de fonte de dados. O armazenamento de vetores propriamente dito não é excluído, apenas os dados. Esse sinalizador será ignorado se uma conta da AWS for excluída.

    • Reter: retém todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

  7. Escolha Sincronizar.

  8. Um banner verde aparece quando a sincronização é concluída e o Status se torna Pronto.

API
Como atualizar uma fonte de dados
  1. (Opcional) Envie uma solicitação UpdateDataSource com um endpoint de tempo de compilação do Agentes para Amazon Bedrock, alterando todas as configurações e especificando as mesmas configurações que você não deseja alterar. Se você alterar os detalhes da configuração da fonte ou do endpoint, deverá atualizar ou criar um perfil do IAM com as permissões de acesso necessárias e o segredo do Secrets Manager (se aplicável).

    nota

    Não é possível alterar a chunkingConfiguration. Envie a solicitação com a chunkingConfiguration existente ou recrie a fonte de dados.

  2. (Opcional) Altere a dataDeletionPolicy da fonte de dados. É possível DELETE todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Esse sinalizador será ignorado se uma conta da AWS for excluída. É possível RETAIN todos os dados da fonte de dados que são convertidos em incorporações de vetores após a exclusão de uma base de conhecimento ou recurso de fonte de dados. Observe que o armazenamento de vetores em si não será excluído se você excluir uma base de conhecimento ou um recurso de fonte de dados.

  3. Envie uma solicitação StartIngestionJob com um endpoint de tempo de compilação do Agentes para Amazon Bedrock, especificando o dataSourceId e o knowledgeBaseId.