Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consulta de una base de conocimiento y generación de respuestas en función de los datos recuperados
Las barreras de protección se aplican únicamente a la entrada y a la respuesta generada por el LLM. No se aplican a las referencias recuperadas de las bases de conocimiento en tiempo de ejecución.
Una vez configurada la base de conocimiento, puede consultarla y generar respuestas basadas en los fragmentos recuperados del origen de datos mediante la operación de la API RetrieveAndGenerate. Las respuestas se devuelven con citas a los datos de origen originales. También puede utilizar un modelo de reclasificación en lugar del clasificador predeterminado de Bases de conocimiento de Amazon Bedrock para clasificar los fragmentos de origen según su relevancia durante la recuperación.
Limitaciones del contenido multimodal
RetrieveAndGeneratetiene un soporte limitado para el contenido multimodal. Al utilizar Nova Multimodal Embeddings, la funcionalidad de RAG se limita únicamente al contenido de texto. Para obtener un soporte multimodal completo, incluido el procesamiento de audio y vídeo, utilice BDA con modelos de incrustación de texto. Para obtener más información, consulte Cree una base de conocimientos para contenido multimodal.
Las imágenes devueltas de la respuesta Retrieve durante el flujo RetrieveAndGenerate se incluyen en la petición de generación de respuestas. La respuesta RetrieveAndGenerate no puede incluir imágenes, pero puede citar los orígenes que las contienen.
Para obtener información sobre cómo consultar una base de conocimiento, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:
- Console
-
Prueba de la base de conocimientos
-
Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock.
-
En el panel de navegación izquierdo, elija Bases de conocimientos.
-
En la sección Bases de conocimientos, realice una de las siguientes acciones:
-
Elija el botón de opción situado junto a la base de conocimientos que quiera probar y seleccione Probar la base de conocimientos. La ventana de prueba se expande desde la derecha.
-
Elija la base de conocimientos que desea probar. La ventana de prueba se expande desde la derecha.
-
Para generar respuestas sobre la base de información obtenida directamente de su base de conocimientos, active Generar respuestas para su consulta. Amazon Bedrock generará respuestas en función de los orígenes de datos y citará la información que proporcione con notas a pie de página.
-
Para elegir el modelo que se usará para la generación de respuestas, elija Seleccionar modelo. A continuación, seleccione Aplicar.
-
(Opcional) Seleccione el icono de configuración (
) para abrir Configuraciones. Para obtener información sobre las configuraciones, consulte Configuración y personalización de las consultas y la generación de respuestas.
-
Introduzca una consulta en el cuadro de texto de la ventana de chat y seleccione Ejecutar para obtener respuestas de la base de conocimientos.
-
Seleccione una nota a pie de página para ver un extracto del origen citado para esa parte de la respuesta. Elija el enlace para ir al objeto S3 que contiene el archivo.
-
Para ver los detalles de los fragmentos devueltos, seleccione Mostrar detalles del origen.
-
Para ver las configuraciones que ha configurado para la consulta, expanda Configuraciones de consulta.
-
Para ver los detalles de un fragmento de origen, expándalo seleccionando la flecha hacia la derecha (
) situada junto a él. Puede ver la siguiente información:
-
El texto sin procesar del fragmento de origen. Para copiar este texto, elija el icono de copia (
). Si utilizó Amazon S3 para almacenar los datos, elija el icono de enlace externo (
) para acceder al objeto de S3 que contiene el archivo.
-
Los metadatos asociados al fragmento de origen, si utilizó Amazon S3 para almacenar sus datos. Las attribute/field claves y los valores se definen en el .metadata.json archivo asociado al documento fuente. Para obtener información, consulte la sección Metadatos y filtrado de Configuración y personalización de las consultas y la generación de respuestas.
Opciones de chat
-
Para elegir un modelo diferente para la generación de respuestas, elija Cambiar modelo. Si cambia el modelo, el texto de la ventana de chat se borrará por completo.
-
Cambie a la opción de recuperar fragmentos de origen directamente desactivando la opción Generar respuestas. Si cambia la configuración, el texto de la ventana de chat se borrará por completo.
-
Para borrar la ventana de chat, seleccione el icono de la escoba (
).
-
Para copiar todo el resultado en la ventana de chat, seleccione el icono de copiar (
).
- API
-
Para consultar una base de conocimientos y utilizar un modelo fundacional para generar respuestas basadas en los resultados de los orígenes de datos, envíe una solicitud RetrieveAndGenerate con un punto de conexión en tiempo de ejecución de Agentes para Amazon Bedrock.
La API RetrieveAndGenerateStream devuelve los datos en un formato de streaming y permite acceder a las respuestas generadas en fragmentos sin tener que esperar el resultado completo.
Los siguientes campos son obligatorios:
La respuesta de la API contiene eventos de citas. El miembro citation ya no se utiliza. Le recomendamos que utilice los campos generatedResponse y retrievedReferences en su lugar. Como referencia, consulte CitationEvent.
| Campo |
Descripción básica |
| input |
Contiene un campo text para especificar la consulta. |
| retrieveAndGenerateConfiguración |
Contiene una RetrieveAndGenerateConfiguration, que especifica las configuraciones de recuperación y generación. Consulte a continuación para obtener más detalles. |
Los siguientes campos son opcionales:
| Campo |
Caso de uso |
| sessionId |
Usar el mismo valor que en una sesión anterior para continuar con esa sesión y mantener su contexto para el modelo. |
| sessionConfiguration |
Incluir una clave de KMS para el cifrado de la sesión |
Incluya el knowledgeBaseConfiguration campo en. RetrieveAndGenerateConfiguration Este campo se asigna a un KnowledgeBaseRetrieveAndGenerateConfigurationobjeto, que contiene los siguientes campos:
Puede utilizar un modelo de reclasificación en lugar del modelo de clasificación predeterminado de Amazon Bedrock Knowledge Bases incluyendo el rerankingConfiguration campo dentro del KnowledgeBaseVectorSearchConfiguration. KnowledgeBaseRetrievalConfiguration El rerankingConfiguration campo se asigna a un VectorSearchRerankingConfigurationobjeto, en el que puede especificar el modelo de reclasificación que se va a utilizar, los campos de solicitud adicionales que se van a incluir, los atributos de metadatos para filtrar los documentos durante la reclasificación y el número de resultados que se devolverán tras la reclasificación. Para obtener más información, consulte VectorSearchRerankingConfiguration.
La respuesta devuelve la respuesta generada en el campo output y los fragmentos del origen citados como una matriz en el campo citations. Cada objeto Citation incluye los siguientes campos:
| Campo |
Descripción básica |
| generatedResponsePart |
En el campo textResponsePart, se incluye el text al que pertenece la cita. El campo span proporciona los índices del principio y el final de la parte del resultado que contiene una cita. |
| retrievedReferences |
Matriz de RetrievedReferenceobjetos, cada uno content de los cuales contiene el fragmento de origen metadata asociado al documento y el URI o la URL location del documento en la fuente de datos. Si el contenido es una imagen, el URI de datos del contenido codificado en base64 se devuelve en el siguiente formato: data:image/jpeg;base64,${base64-encoded string}. |
La respuesta también devuelve un valor sessionId, que puede reutilizar en otra solicitud para mantener la misma conversación.
Si incluyó un elemento guardrailConfiguration en la solicitud, el campo guardrailAction indica si el contenido estaba bloqueado o no.
Si los datos recuperados contienen imágenes, la respuesta también devuelve los siguientes encabezados de respuesta, que contienen los metadatos de los fragmentos de origen devueltos en la respuesta:
Si recibe un error que indica que la petición supera el límite de caracteres al generar las respuestas, puede acortarla de las siguientes maneras: