Como criar sistemas de RAG com o Amazon Nova
A geração aumentada via recuperação (RAG) otimiza a saída de um grande modelo de linguagem (LLM) referenciando uma base de conhecimento confiável fora de suas fontes de dados de treinamento antes de gerar uma resposta. Essa abordagem ajuda a fornecer informações atuais ao modelo e fundamentá-lo em dados proprietários ou específicos do domínio. Também fornece uma fonte de informações controlável, que você pode usar para definir controles de acesso a conteúdo específico e solucionar problemas nas respostas.
O RAG funciona conectando um gerador (geralmente um LLM) a um banco de dados de conteúdo (como um repositório de conhecimento) por meio de um recuperador. O recuperador é responsável por encontrar informações relevantes. Na maioria das aplicações empresariais, o banco de dados de conteúdo é um armazenamento de vetores, o recuperador é um modelo de incorporação e o gerador é um LLM. Para obter mais informações, consulte Geração aumentada via recuperação (RAG)
Um sistema de RAG tem vários componentes. Este guia se concentra em como usar o Amazon Nova como LLM em qualquer sistema de RAG.
Você pode usar os modelos do Amazon Nova como o LLM dentro de um sistema de RAG de texto. Com os modelos do Amazon Nova, você tem a flexibilidade de criar um sistema de RAG com Bases de Conhecimento para Amazon Bedrock ou criar seu próprio sistema de RAG. Você também pode associar sua base de conhecimento a um agente no Amazon Bedrock Agents para adicionar capacidades de RAG ao agente. Para obter mais informações, consulte Automate tasks in your application using conversational agents.