Consulta de una base de conocimiento y generación de respuestas en función de los datos recuperados - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Consulta de una base de conocimiento y generación de respuestas en función de los datos recuperados

importante

Las barreras de protección se aplican únicamente a la entrada y a la respuesta generada por el LLM. No se aplican a las referencias recuperadas de las bases de conocimiento en tiempo de ejecución.

Una vez configurada la base de conocimiento, puede consultarla y generar respuestas basadas en los fragmentos recuperados del origen de datos mediante la operación de la API RetrieveAndGenerate. Las respuestas se devuelven con citas a los datos de origen originales. También puede utilizar un modelo de reclasificación en lugar del clasificador predeterminado de Bases de conocimiento de Amazon Bedrock para clasificar los fragmentos de origen según su relevancia durante la recuperación.

Limitaciones del contenido multimodal

RetrieveAndGeneratetiene un soporte limitado para el contenido multimodal. Al utilizar Nova Multimodal Embeddings, la funcionalidad de RAG se limita únicamente al contenido de texto. Para obtener un soporte multimodal completo, incluido el procesamiento de audio y vídeo, utilice BDA con modelos de incrustación de texto. Para obtener más información, consulte Cree una base de conocimientos para contenido multimodal.

nota

Las imágenes devueltas de la respuesta Retrieve durante el flujo RetrieveAndGenerate se incluyen en la petición de generación de respuestas. La respuesta RetrieveAndGenerate no puede incluir imágenes, pero puede citar los orígenes que las contienen.

Para obtener información sobre cómo consultar una base de conocimiento, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:

Console
Prueba de la base de conocimientos
  1. Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock.

  2. En el panel de navegación izquierdo, elija Bases de conocimientos.

  3. En la sección Bases de conocimientos, realice una de las siguientes acciones:

    • Elija el botón de opción situado junto a la base de conocimientos que quiera probar y seleccione Probar la base de conocimientos. La ventana de prueba se expande desde la derecha.

    • Elija la base de conocimientos que desea probar. La ventana de prueba se expande desde la derecha.

  4. Para generar respuestas sobre la base de información obtenida directamente de su base de conocimientos, active Generar respuestas para su consulta. Amazon Bedrock generará respuestas en función de los orígenes de datos y citará la información que proporcione con notas a pie de página.

  5. Para elegir el modelo que se usará para la generación de respuestas, elija Seleccionar modelo. A continuación, seleccione Aplicar.

  6. (Opcional) Seleccione el icono de configuración ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) para abrir Configuraciones. Para obtener información sobre las configuraciones, consulte Configuración y personalización de las consultas y la generación de respuestas.

  7. Introduzca una consulta en el cuadro de texto de la ventana de chat y seleccione Ejecutar para obtener respuestas de la base de conocimientos.

  8. Seleccione una nota a pie de página para ver un extracto del origen citado para esa parte de la respuesta. Elija el enlace para ir al objeto S3 que contiene el archivo.

  9. Para ver los detalles de los fragmentos devueltos, seleccione Mostrar detalles del origen.

    • Para ver las configuraciones que ha configurado para la consulta, expanda Configuraciones de consulta.

    • Para ver los detalles de un fragmento de origen, expándalo seleccionando la flecha hacia la derecha ( Play button icon with a triangular shape pointing to the right. ) situada junto a él. Puede ver la siguiente información:

      • El texto sin procesar del fragmento de origen. Para copiar este texto, elija el icono de copia ( Icon representing a crop or resize function, with two overlapping rectangles. ). Si utilizó Amazon S3 para almacenar los datos, elija el icono de enlace externo ( Icon of a square with an arrow pointing outward from its top-right corner. ) para acceder al objeto de S3 que contiene el archivo.

      • Los metadatos asociados al fragmento de origen, si utilizó Amazon S3 para almacenar sus datos. Las attribute/field claves y los valores se definen en el .metadata.json archivo asociado al documento fuente. Para obtener información, consulte la sección Metadatos y filtrado de Configuración y personalización de las consultas y la generación de respuestas.

Opciones de chat
  • Para elegir un modelo diferente para la generación de respuestas, elija Cambiar modelo. Si cambia el modelo, el texto de la ventana de chat se borrará por completo.

  • Cambie a la opción de recuperar fragmentos de origen directamente desactivando la opción Generar respuestas. Si cambia la configuración, el texto de la ventana de chat se borrará por completo.

  • Para borrar la ventana de chat, seleccione el icono de la escoba ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Para copiar todo el resultado en la ventana de chat, seleccione el icono de copiar ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Para consultar una base de conocimientos y utilizar un modelo fundacional para generar respuestas basadas en los resultados de los orígenes de datos, envíe una solicitud RetrieveAndGenerate con un punto de conexión en tiempo de ejecución de Agentes para Amazon Bedrock.

La API RetrieveAndGenerateStream devuelve los datos en un formato de streaming y permite acceder a las respuestas generadas en fragmentos sin tener que esperar el resultado completo.

Los siguientes campos son obligatorios:

nota

La respuesta de la API contiene eventos de citas. El miembro citation ya no se utiliza. Le recomendamos que utilice los campos generatedResponse y retrievedReferences en su lugar. Como referencia, consulte CitationEvent.

Campo Descripción básica
input Contiene un campo text para especificar la consulta.
retrieveAndGenerateConfiguración Contiene una RetrieveAndGenerateConfiguration, que especifica las configuraciones de recuperación y generación. Consulte a continuación para obtener más detalles.

Los siguientes campos son opcionales:

Campo Caso de uso
sessionId Usar el mismo valor que en una sesión anterior para continuar con esa sesión y mantener su contexto para el modelo.
sessionConfiguration Incluir una clave de KMS para el cifrado de la sesión

Incluya el knowledgeBaseConfiguration campo en. RetrieveAndGenerateConfiguration Este campo se asigna a un KnowledgeBaseRetrieveAndGenerateConfigurationobjeto, que contiene los siguientes campos:

  • Los siguientes campos son obligatorios:

    Campo Descripción básica
    knowledgeBaseId El ID de la base de conocimiento que se va a consultar.
    modelArn El ARN del modelo fundacional o perfil de inferencia que se utilizará para la generación.
  • Los siguientes campos son opcionales:

    Campo Caso de uso
    retrievalConfiguration Para incluir configuraciones de consulta para personalizar la búsqueda vectorial. Para obtener más información, consulte KnowledgeBaseRetrievalConfiguration.
    orchestrationConfiguration Especificar las configuraciones de cómo el modelo procesa la petición antes de la recuperación y la generación. Para obtener más información, consulte OrchestrationConfiguration.
    generationConfiguration Especificar las configuraciones para la generación de respuestas. Para obtener más información, consulte GenerationConfiguration.

Puede utilizar un modelo de reclasificación en lugar del modelo de clasificación predeterminado de Amazon Bedrock Knowledge Bases incluyendo el rerankingConfiguration campo dentro del KnowledgeBaseVectorSearchConfiguration. KnowledgeBaseRetrievalConfiguration El rerankingConfiguration campo se asigna a un VectorSearchRerankingConfigurationobjeto, en el que puede especificar el modelo de reclasificación que se va a utilizar, los campos de solicitud adicionales que se van a incluir, los atributos de metadatos para filtrar los documentos durante la reclasificación y el número de resultados que se devolverán tras la reclasificación. Para obtener más información, consulte VectorSearchRerankingConfiguration.

nota

Si el numberOfRerankedResults valor que especifica es mayor que el numberOfResults valor de KnowledgeBaseVectorSearchConfiguration, el número máximo de resultados que se devolverán será el valor correspondiente. numberOfResults Una excepción es si utiliza la descomposición de consultas (para obtener más información, consulte la sección Modificaciones de consultas en Configuración y personalización de las consultas y la generación de respuestas). Si utiliza la descomposición de consultas, numberOfRerankedResults puede ser hasta cinco veces mayor que numberOfResults.

La respuesta devuelve la respuesta generada en el campo output y los fragmentos del origen citados como una matriz en el campo citations. Cada objeto Citation incluye los siguientes campos:

Campo Descripción básica
generatedResponsePart En el campo textResponsePart, se incluye el text al que pertenece la cita. El campo span proporciona los índices del principio y el final de la parte del resultado que contiene una cita.
retrievedReferences Matriz de RetrievedReferenceobjetos, cada uno content de los cuales contiene el fragmento de origen metadata asociado al documento y el URI o la URL location del documento en la fuente de datos. Si el contenido es una imagen, el URI de datos del contenido codificado en base64 se devuelve en el siguiente formato: data:image/jpeg;base64,${base64-encoded string}.

La respuesta también devuelve un valor sessionId, que puede reutilizar en otra solicitud para mantener la misma conversación.

Si incluyó un elemento guardrailConfiguration en la solicitud, el campo guardrailAction indica si el contenido estaba bloqueado o no.

Si los datos recuperados contienen imágenes, la respuesta también devuelve los siguientes encabezados de respuesta, que contienen los metadatos de los fragmentos de origen devueltos en la respuesta:

  • x-amz-bedrock-kb-byte-content-source: contiene el URI de Amazon S3 de la imagen.

  • x-amz-bedrock-kb-description: contiene la cadena codificada en base64 de la imagen.

nota

No puede filtrar estos encabezados de respuesta de metadatos al configurar los filtros de metadatos.

nota

Si recibe un error que indica que la petición supera el límite de caracteres al generar las respuestas, puede acortarla de las siguientes maneras: