Consulta de una base de conocimiento y generación de respuestas en función de los datos recuperados

importante

Las barreras de protección se aplican únicamente a la entrada y a la respuesta generada por el LLM. No se aplican a las referencias recuperadas de las bases de conocimiento en tiempo de ejecución.

Una vez configurada la base de conocimiento, puede consultarla y generar respuestas basadas en los fragmentos recuperados del origen de datos mediante la operación de la API RetrieveAndGenerate. Las respuestas se devuelven con citas a los datos de origen originales. También puede utilizar un modelo de reclasificación en lugar del clasificador predeterminado de Bases de conocimiento de Amazon Bedrock para clasificar los fragmentos de origen según su relevancia durante la recuperación.

Limitaciones del contenido multimodal

RetrieveAndGeneratetiene un soporte limitado para el contenido multimodal. Al utilizar Nova Multimodal Embeddings, la funcionalidad de RAG se limita únicamente al contenido de texto. Para obtener un soporte multimodal completo, incluido el procesamiento de audio y vídeo, utilice BDA con modelos de incrustación de texto. Para obtener más información, consulte Cree una base de conocimientos para contenido multimodal.

nota

Las imágenes devueltas de la respuesta Retrieve durante el flujo RetrieveAndGenerate se incluyen en la petición de generación de respuestas. La respuesta RetrieveAndGenerate no puede incluir imágenes, pero puede citar los orígenes que las contienen.

Para obtener información sobre cómo consultar una base de conocimiento, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:

Console

Prueba de la base de conocimientos

Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock.
En el panel de navegación izquierdo, elija Bases de conocimientos.
En la sección Bases de conocimientos, realice una de las siguientes acciones:
- Elija el botón de opción situado junto a la base de conocimientos que quiera probar y seleccione Probar la base de conocimientos. La ventana de prueba se expande desde la derecha.
- Elija la base de conocimientos que desea probar. La ventana de prueba se expande desde la derecha.
Para generar respuestas sobre la base de información obtenida directamente de su base de conocimientos, active Generar respuestas para su consulta. Amazon Bedrock generará respuestas en función de los orígenes de datos y citará la información que proporcione con notas a pie de página.
Para elegir el modelo que se usará para la generación de respuestas, elija Seleccionar modelo. A continuación, seleccione Aplicar.
(Opcional) Seleccione el icono de configuración ( ) para abrir Configuraciones. Para obtener información sobre las configuraciones, consulte Configuración y personalización de las consultas y la generación de respuestas.
Introduzca una consulta en el cuadro de texto de la ventana de chat y seleccione Ejecutar para obtener respuestas de la base de conocimientos.
Seleccione una nota a pie de página para ver un extracto del origen citado para esa parte de la respuesta. Elija el enlace para ir al objeto S3 que contiene el archivo.
Para ver los detalles de los fragmentos devueltos, seleccione Mostrar detalles del origen.
- Para ver las configuraciones que ha configurado para la consulta, expanda Configuraciones de consulta.
- Para ver los detalles de un fragmento de origen, expándalo seleccionando la flecha hacia la derecha ( ) situada junto a él. Puede ver la siguiente información:
  - El texto sin procesar del fragmento de origen. Para copiar este texto, elija el icono de copia ( ). Si utilizó Amazon S3 para almacenar los datos, elija el icono de enlace externo ( ) para acceder al objeto de S3 que contiene el archivo.
  - Los metadatos asociados al fragmento de origen, si utilizó Amazon S3 para almacenar sus datos. Las attribute/field claves y los valores se definen en el .metadata.json archivo asociado al documento fuente. Para obtener información, consulte la sección Metadatos y filtrado de Configuración y personalización de las consultas y la generación de respuestas.

Opciones de chat

Para elegir un modelo diferente para la generación de respuestas, elija Cambiar modelo. Si cambia el modelo, el texto de la ventana de chat se borrará por completo.
Cambie a la opción de recuperar fragmentos de origen directamente desactivando la opción Generar respuestas. Si cambia la configuración, el texto de la ventana de chat se borrará por completo.
Para borrar la ventana de chat, seleccione el icono de la escoba ( ).
Para copiar todo el resultado en la ventana de chat, seleccione el icono de copiar ( ).

API

Para consultar una base de conocimientos y utilizar un modelo fundacional para generar respuestas basadas en los resultados de los orígenes de datos, envíe una solicitud RetrieveAndGenerate con un punto de conexión en tiempo de ejecución de Agentes para Amazon Bedrock.

La API RetrieveAndGenerateStream devuelve los datos en un formato de streaming y permite acceder a las respuestas generadas en fragmentos sin tener que esperar el resultado completo.

Los siguientes campos son obligatorios:

nota

La respuesta de la API contiene eventos de citas. El miembro citation ya no se utiliza. Le recomendamos que utilice los campos generatedResponse y retrievedReferences en su lugar. Como referencia, consulte CitationEvent.

Campo	Descripción básica
input	Contiene un campo `text` para especificar la consulta.
recuperar AndGenerateConfiguration	Contiene un RetrieveAndGenerateConfiguration, que especifica las configuraciones de recuperación y generación. Consulte a continuación para obtener más detalles.

Los siguientes campos son opcionales:

Campo	Caso de uso
sessionId	Usar el mismo valor que en una sesión anterior para continuar con esa sesión y mantener su contexto para el modelo.
sessionConfiguration	Incluir una clave de KMS para el cifrado de la sesión

Incluya el knowledgeBaseConfiguration campo en. RetrieveAndGenerateConfiguration Este campo se asigna a un KnowledgeBaseRetrieveAndGenerateConfigurationobjeto, que contiene los siguientes campos:

Los siguientes campos son obligatorios:

Campo	Descripción básica
conocimiento BaseId	El ID de la base de conocimiento que se va a consultar.
modelArn	El ARN del modelo fundacional o perfil de inferencia que se utilizará para la generación.

Los siguientes campos son opcionales:

Campo	Caso de uso
retrievalConfiguration	Para incluir configuraciones de consulta para personalizar la búsqueda vectorial. Para obtener más información, consulte KnowledgeBaseRetrievalConfiguration.
orchestrationConfiguration	Para especificar las configuraciones de cómo el modelo procesa la solicitud antes de la recuperación y la generación. Para obtener más información, consulte OrchestrationConfiguration.
generationConfiguration	Especificar las configuraciones para la generación de respuestas. Para obtener más información, consulte GenerationConfiguration.

Puede utilizar un modelo de reclasificación en lugar del modelo de clasificación predeterminado de Amazon Bedrock Knowledge Bases incluyendo el rerankingConfiguration campo dentro del KnowledgeBaseVectorSearchConfiguration. KnowledgeBaseRetrievalConfiguration El rerankingConfiguration campo se asigna a un VectorSearchRerankingConfigurationobjeto, en el que puede especificar el modelo de reclasificación que se va a utilizar, los campos de solicitud adicionales que se van a incluir, los atributos de metadatos para filtrar los documentos durante la reclasificación y el número de resultados que se devolverán tras la reclasificación. Para obtener más información, consulte VectorSearchRerankingConfiguration.

nota

Si el numberOfRerankedResults valor que especifica es mayor que el numberOfResults valor de KnowledgeBaseVectorSearchConfiguration, el número máximo de resultados que se devolverán será el valor correspondiente. numberOfResults Una excepción es si utiliza la descomposición de consultas (para obtener más información, consulte la sección Modificaciones de consultas en Configuración y personalización de las consultas y la generación de respuestas). Si utiliza la descomposición de consultas, numberOfRerankedResults puede ser hasta cinco veces mayor que numberOfResults.

La respuesta devuelve la respuesta generada en el campo output y los fragmentos del origen citados como una matriz en el campo citations. Cada objeto Citation incluye los siguientes campos:

Campo	Descripción básica
generado ResponsePart	En el campo `textResponsePart`, se incluye el `text` al que pertenece la cita. El campo `span` proporciona los índices del principio y el final de la parte del resultado que contiene una cita.
retrievedReferences	Una matriz de RetrievedReferenceobjetos, cada uno `content` de los cuales contiene el fragmento de origen `metadata` asociado al documento y el URI o la URL `location` del documento en la fuente de datos. Si el contenido es una imagen, el URI de datos del contenido codificado en base64 se devuelve en el siguiente formato: `data:image/jpeg;base64,${base64-encoded string}`.

La respuesta también devuelve un valor sessionId, que puede reutilizar en otra solicitud para mantener la misma conversación.

Si incluyó un elemento guardrailConfiguration en la solicitud, el campo guardrailAction indica si el contenido estaba bloqueado o no.

Si los datos recuperados contienen imágenes, la respuesta también devuelve los siguientes encabezados de respuesta, que contienen los metadatos de los fragmentos de origen devueltos en la respuesta:

x-amz-bedrock-kb-byte-content-source: contiene el URI de Amazon S3 de la imagen.
x-amz-bedrock-kb-description: contiene la cadena codificada en base64 de la imagen.

nota

No puede filtrar estos encabezados de respuesta de metadatos al configurar los filtros de metadatos.

nota

Si recibe un error que indica que la petición supera el límite de caracteres al generar las respuestas, puede acortarla de las siguientes maneras:

Reduzca el número máximo de resultados recuperados (de esta forma, se acorta lo que se rellena para el marcador de posición $search_results$ en las Plantillas de solicitudes de base de conocimientos: generación de orquestaciones &).
Vuelva a crear el origen de datos con una estrategia de fragmentación que utilice fragmentos más pequeños (de este modo, se acorta lo que se rellena para el marcador de posición $search_results$ en las Plantillas de solicitudes de base de conocimientos: generación de orquestaciones &).
Acorte la plantilla de la petición.
Acorte la consulta del usuario (esto acorta lo que se rellena para el marcador de posición $query$ en las Plantillas de solicitudes de base de conocimientos: generación de orquestaciones &).

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Consulta de una base de conocimiento y recuperación de datos

Generación de una consulta de datos estructurados