Creación de sistemas de RAG con Amazon Nova

nota

Esta documentación corresponde a la versión 1 de Amazon Nova. Amazon Nova 2 ya está disponible con nuevos modelos y funciones mejoradas. Las nuevas características y actualizaciones de la documentación se publican en la Guía del usuario de Amazon Nova 2. Para obtener información, consulte What's new in Amazon Nova 2.

La generación aumentada por recuperación (RAG) optimiza el resultado de un modelo de lenguaje de gran tamaño (LLM) al hacer referencia a una base de conocimientos acreditada fuera de sus fuentes de datos de entrenamiento antes de generar una respuesta. Este enfoque ayuda a proporcionar al modelo información actualizada y a fundamentarlo en datos específicos de un dominio o datos patentados. También proporciona una fuente de información controlable que puede utilizar para establecer controles de acceso a contenido específico y solucionar problemas en las respuestas.

La RAG funciona conectando un generador (normalmente un LLM) a una base de datos de contenido (como un almacén de conocimientos) a través de un recuperador. El recuperador es responsable de encontrar la información relevante. En la mayoría de las aplicaciones empresariales, la base de datos de contenido es un almacén vectorial, el recuperador es un modelo de incrustación y el generador es un LLM. Para obtener más información, consulte Generación aumentada por recuperación y Bases de conocimientos de Bedrock.

Un sistema de RAG tiene varios componentes. Esta guía se centra en cómo utilizar Amazon Nova como LLM en cualquier sistema de RAG.

Puede utilizar los modelos de Amazon Nova como LLM dentro de un sistema de RAG de texto. Con los modelos de Amazon Nova, tiene la flexibilidad de crear un sistema de RAG con bases de conocimiento de Amazon Bedrock o crear su propio sistema de RAG. También puede asociar su base de conocimientos a un agente en Amazon Bedrock Agents para añadir capacidades de RAG al agente. Para obtener más información, consulte Automatización de tareas de una aplicación mediante agentes conversacionales.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Web Grounding

Uso de bases de conocimiento de Amazon Bedrock