Como funcionam as bases de conhecimento do Amazon Bedrock

O Amazon Bedrock Knowledge Bases ajuda você a aproveitar as vantagens da geração aumentada via recuperação (RAG), uma técnica conhecida que envolve extrair informações de um datastore para aumentar as respostas geradas por grandes modelos de linguagem (LLMs). Quando você configura uma base de conhecimento com fonte de dados, a aplicação pode consultar a base de conhecimento para exibir informações e responder à consulta com citações diretas das fontes ou com respostas naturais geradas com base nos resultados da consulta.

Com as Bases de Conhecimento do Amazon Bedrock, é possível criar aplicações enriquecidas pelo contexto recebido da consulta a uma base de conhecimento. Isso acelera o tempo de lançamento no mercado ao evitar o trabalho pesado da criação de pipelines, fornecendo a você uma solução de RAG pronta para usar a fim de reduzir o tempo de compilação da aplicação. Adicionar uma base de conhecimento também aumenta a relação custo-benefício, eliminando a necessidade de treinar continuamente seu modelo para poder usar seus dados privados.

Os diagramas a seguir ilustram esquematicamente como a RAG é realizada. A base de conhecimento simplifica a configuração e a implementação da RAG, automatizando várias etapas desse processo.

Pre-processing dados não estruturados

Para permitir a recuperação eficaz de dados privados estruturados (dados que não existem em um armazenamento de dados estruturados), uma prática comum é converter os dados em texto e dividi-los em partes gerenciáveis. As partes ou fragmentos são convertidos em incorporações e gravados em um índice de vetores, mantendo uma correção com o documento original. Essas incorporações são usadas para determinar a semelhança semântica entre as consultas e o texto das fontes de dados. A imagem a seguir ilustra o pré-processamento de dados para o banco de dados de vetores.

Pre-processing dados para geração de recuperação aumentada.

As incorporações de vetores são uma série de números que representam cada fragmento de texto. Um modelo converte cada fragmento de texto em uma série de números, conhecidos como vetores, para que os textos possam ser comparados matematicamente. Esses vetores podem ser números de ponto flutuante (float32) ou números binários. A maioria dos modelos de incorporação compatíveis com o Amazon Bedrock usa vetores de ponto flutuante por padrão. No entanto, alguns modelos oferecem suporte a vetores binários. Se você escolher um modelo de incorporação de vetores binários, também deverá escolher um modelo e um armazenamento de vetores que ofereça suporte a vetores binários.

Os vetores binários, que usam apenas 1 bit por dimensão, não têm um armazenamento tão caro quanto os vetores de ponto flutuante (float32), que usam 32 bits por dimensão. No entanto, os vetores binários não são tão precisos quanto os vetores de ponto flutuante com relação à representação do texto.

O seguinte exemplo mostra um trecho de texto em três representações:

Representação	Valor
Texto	“O Amazon Bedrock usa modelos de base de alto desempenho das principais empresas de IA e da Amazon.”
Floating-point vetor	`[0.041..., 0.056..., -0.018..., -0.012..., -0.020..., ...]`
Vetor binário	`[1,1,0,0,0, ...]`

Execução do Runtime

Em tempo de execução, um modelo de incorporação é usado para converter a consulta do usuário em um vetor. O índice de vetores é consultado para encontrar partes que sejam semanticamente semelhantes à consulta do usuário, comparando os vetores do documento com o vetor de consulta do usuário. Na etapa final, o prompt do usuário é aumentado com o contexto adicional dos fragmentos que são recuperados do índice de vetores. O prompt e o contexto adicional são enviados ao modelo para gerar uma resposta para o usuário. A imagem a seguir ilustra como a RAG opera em tempo de execução para aumentar as respostas às consultas dos usuários.

Retrieval-augmented geração em tempo de execução.

Para saber mais sobre como transformar seus dados em uma base de conhecimento, como consultar a base de conhecimento depois de configurá-la e personalizações que é possível aplicar à fonte de dados durante a ingestão, consulte os seguintes tópicos:

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Bases de conhecimento

Transformar dados em uma base de conhecimento