Creación de sistemas de RAG con Amazon Nova
La generación aumentada por recuperación (RAG) optimiza el resultado de un modelo de lenguaje de gran tamaño (LLM) al hacer referencia a una base de conocimientos acreditada fuera de sus fuentes de datos de entrenamiento antes de generar una respuesta. Este enfoque ayuda a proporcionar al modelo información actualizada y a fundamentarlo en datos específicos de un dominio o datos patentados. También proporciona una fuente de información controlable que puede utilizar para establecer controles de acceso a contenido específico y solucionar problemas en las respuestas.
La RAG funciona conectando un generador (normalmente un LLM) a una base de datos de contenido (como un almacén de conocimientos) a través de un recuperador. El recuperador es responsable de encontrar la información relevante. En la mayoría de las aplicaciones empresariales, la base de datos de contenido es un almacén vectorial, el recuperador es un modelo de incrustación y el generador es un LLM. Para obtener más información, consulte Generación aumentada por recuperación
Un sistema de RAG tiene varios componentes. Esta guía se centra en cómo utilizar Amazon Nova como LLM en cualquier sistema de RAG.
Puede utilizar los modelos de Amazon Nova como LLM dentro de un sistema de RAG de texto. Con los modelos de Amazon Nova, tiene la flexibilidad de crear un sistema de RAG con bases de conocimiento de Amazon Bedrock o crear su propio sistema de RAG. También puede asociar su base de conocimientos a un agente en Amazon Bedrock Agents para añadir capacidades de RAG al agente. Para obtener más información, consulte Automatización de tareas de una aplicación mediante agentes conversacionales.