Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Consulta de una base de conocimiento y recuperación de datos
importante
Las barreras de protección se aplican únicamente a la entrada y a la respuesta generada por el LLM. No se aplican a las referencias recuperadas de las bases de conocimiento en tiempo de ejecución.
Una vez configurada la base de conocimiento, puede consultarla y recuperar fragmentos de los datos de origen que sean relevantes para la consulta mediante la operación de la API Retrieve. También puede utilizar un modelo de reclasificación en lugar del clasificador predeterminado de Bases de conocimiento de Amazon Bedrock para clasificar los fragmentos de origen según su relevancia durante la recuperación.
Para obtener información sobre cómo consultar una base de conocimiento, seleccione la pestaña correspondiente al método que prefiera y siga los pasos:
- Console
-
Prueba de la base de conocimientos
-
Inicie sesión Consola de administración de AWS con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola de Amazon Bedrock en https://console.aws.amazon.com/bedrock.
-
En el panel de navegación izquierdo, elija Bases de conocimientos.
-
En la sección Bases de conocimientos, realice una de las siguientes acciones:
-
Elija el botón de opción situado junto a la base de conocimientos que quiera probar y seleccione Probar la base de conocimientos. La ventana de prueba se expande desde la derecha.
-
Elija la base de conocimientos que desea probar. La ventana de prueba se expande desde la derecha.
-
-
En la ventana de prueba, desactive Generar respuestas para su consulta para que se devuelva la información recuperada directamente de su base de conocimiento.
-
(Opcional) Seleccione el icono de configuración (
) para abrir Configuraciones. Para obtener información sobre las configuraciones, consulte Configuración y personalización de las consultas y la generación de respuestas. -
Introduzca una consulta en el cuadro de texto de la ventana de chat y seleccione Ejecutar para obtener respuestas de la base de conocimientos.
-
Los fragmentos de origen se devuelven directamente en orden de relevancia. Las imágenes extraídas del origen de datos también se pueden devolver como un fragmento del origen.
-
Para ver los detalles de los fragmentos devueltos, seleccione Mostrar detalles del origen.
-
Para ver las configuraciones que ha configurado para la consulta, expanda Configuraciones de consulta.
-
Para ver los detalles de un fragmento de origen, expándalo seleccionando la flecha hacia la derecha (
) situada junto a él. Puede ver la siguiente información:-
El texto sin procesar del fragmento de origen. Para copiar este texto, elija el icono de copia (
). Si utilizó Amazon S3 para almacenar los datos, elija el icono de enlace externo (
) para acceder al objeto de S3 que contiene el archivo. -
Los metadatos asociados al fragmento de origen, si utilizó Amazon S3 para almacenar sus datos. Las attribute/field claves y los valores se definen en el
.metadata.jsonarchivo asociado al documento fuente. Para obtener información, consulte la sección Metadatos y filtrado de Configuración y personalización de las consultas y la generación de respuestas.
-
-
Opciones de chat
-
Cambie a la generación de respuestas basadas en los fragmentos de origen recuperados activando la opción Generar respuestas. Si cambia la configuración, el texto de la ventana de chat se borrará por completo.
-
Para borrar la ventana de chat, seleccione el icono de la escoba (
). -
Para copiar todo el resultado en la ventana de chat, seleccione el icono de copiar (
).
-
- API
-
Para consultar una base de conocimiento y devolver solo el texto pertinente de los orígenes de datos, envíe una solicitud Retrieve a un punto de conexión en tiempo de ejecución de Agentes para Amazon Bedrock.
Los siguientes campos son obligatorios:
Campo Descripción básica knowledgeBaseId Especificar la base de conocimiento que se va a consultar retrievalQuery Contiene un campo textpara especificar la consulta.guardrailsConfiguration Incluye campos guardrailsConfiguration, como guardrailsIdyguardrailsVersion, para usar su barrera de protección con la solicitud.Los siguientes campos son opcionales:
Campo Caso de uso nextToken Devolver el siguiente lote de resultados (consulte los campos de respuesta a continuación). retrievalConfiguration Para incluir configuraciones de consulta para personalizar la búsqueda vectorial. Para obtener más información, consulte KnowledgeBaseVectorSearchConfiguration. Puede utilizar un modelo de reclasificación sobre el modelo de clasificación predeterminado de Amazon Bedrock Knowledge Bases incluyendo el
rerankingConfigurationcampo en. KnowledgeBaseVectorSearchConfiguration ElrerankingConfigurationcampo se asigna a un VectorSearchRerankingConfigurationobjeto, en el que puede especificar el modelo de reclasificación que se va a utilizar, los campos de solicitud adicionales que se van a incluir, los atributos de metadatos para filtrar los documentos durante la reclasificación y el número de resultados que se devolverán tras la reclasificación. Para obtener más información, consulte VectorSearchRerankingConfiguration.nota
Si el
numberOfRerankedResultsvalor que especifica es mayor que elnumberOfResultsvalor de KnowledgeBaseVectorSearchConfiguration, el número máximo de resultados que se devolverán será el valor correspondiente.numberOfResultsUna excepción es si utiliza la descomposición de consultas (para obtener más información, consulte la sección Modificaciones de consultas en Configuración y personalización de las consultas y la generación de respuestas). Si utiliza la descomposición de consultas,numberOfRerankedResultspuede ser hasta cinco veces mayor quenumberOfResults.La respuesta devuelve los fragmentos de la fuente de datos como una matriz de KnowledgeBaseRetrievalResultobjetos en el
retrievalResultscampo. Cada uno KnowledgeBaseRetrievalResultcontiene los siguientes campos:Campo Description (Descripción) content Contiene un fragmento de origen de texto en el campo texto un fragmento de origen de imagen en el campobyteContent. Si el contenido es una imagen, el URI de datos del contenido codificado en base64 se devuelve en el siguiente formato:data:image/jpeg;base64,.${base64-encoded string}metadatos Contiene cada atributo de metadatos como una clave y el valor de metadatos como un valor JSON al que se asigna la clave. ubicación Contiene el URI o la URL del documento al que pertenece el fragmento de origen. puntuación La puntuación de relevancia del documento. Puede utilizar esta puntuación para analizar la clasificación de resultados. Si el número de fragmentos de origen supera lo que cabe en la respuesta, se devuelve un valor en el campo
nextToken. Use ese valor en otra solicitud para devolver el siguiente lote de resultados.Si los datos recuperados contienen imágenes, la respuesta también devuelve los siguientes encabezados de respuesta, que contienen los metadatos de los fragmentos de origen devueltos en la respuesta:
-
x-amz-bedrock-kb-byte-content-source: contiene el URI de Amazon S3 de la imagen. -
x-amz-bedrock-kb-description: contiene la cadena codificada en base64 de la imagen.
nota
No puede filtrar estos encabezados de respuesta de metadatos al configurar los filtros de metadatos.
Consultas multimodales
Para las bases de conocimiento que utilizan modelos de incrustación multimodales, puede realizar consultas con imágenes además de texto. El
retrievalQuerycampo admite unmultimodalInputListcampo para consultas de imágenes:nota
Para obtener una guía completa sobre cómo configurar y trabajar con bases de conocimiento multimodales, incluida la elección entre los enfoques Nova y BDA, consulteCree una base de conocimientos para contenido multimodal.
{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }También puede realizar consultas únicamente con imágenes omitiendo el
textcampo:{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Patrones de consulta multimodales comunes
- Image-to-image búsqueda
-
Sube una imagen para encontrar imágenes visualmente similares. Ejemplo: sube una foto de una zapatilla Nike roja para encontrar zapatillas similares en tu catálogo de productos.
- Refinamiento de texto e imagen
-
Combine texto e imágenes para obtener resultados más precisos. Ejemplo: «Encuentra zapatos similares pero de colores diferentes» junto con la imagen de un zapato cargada.
- Búsqueda visual de documentos
-
Busque gráficos, diagramas o elementos visuales en los documentos. Ejemplo: cargue la imagen de un gráfico para buscar gráficos similares en su colección de documentos.
Elegir entre Nova y BDA para el contenido multimodal
Cuando trabaje con contenido multimodal, elija su enfoque en función del tipo de contenido y los patrones de consulta:
Matriz de decisiones entre Nova y BDA Tipo de contenido Utilice las incrustaciones multimodales de Nova Utilice el analizador Bedrock Data Automation (BDA) Contenido de vídeo Enfoque narrativo visual (deportes, anuncios, demostraciones), consultas sobre elementos visuales, contenido de voz mínimo Preguntas importantes speech/narration (presentaciones, reuniones, tutoriales) sobre el contenido hablado, necesitan transcripciones Contenido de audio Identificación de música o efectos de sonido, análisis de audio sin voz Podcasts, entrevistas, reuniones o cualquier contenido cuyo discurso requiera transcripción Contenido de imagen Búsquedas de similitudes visuales, image-to-image recuperación y análisis de contenido visual Extracción de texto de imágenes, procesamiento de documentos, requisitos de OCR nota
Las incrustaciones multimodales de Nova no pueden procesar el contenido de voz directamente. Si sus archivos de audio o vídeo contienen información hablada importante, utilice primero el analizador BDA para convertir la voz en texto o, en su lugar, elija un modelo de incrustación de texto.
Limitaciones de las consultas multimodales
-
En la versión actual hay un máximo de una imagen por consulta
-
Las consultas de imágenes solo se admiten con los modelos de incrustación multimodales (Titan G1 o Cohere Embed v3)
-
RetrieveAndGenerate La API no es compatible con las bases de conocimiento con modelos de incrustación multimodales y depósitos de contenido de S3
-
Si realizas una consulta de imagen a una base de conocimientos utilizando modelos de incrustación de solo texto, aparecerá un error de 4 x
Estructura de respuesta de la API multimodal
Las respuestas de recuperación del contenido multimodal incluyen metadatos adicionales:
-
URI de origen: apunta a la ubicación original del depósito de S3
-
URI suplementario: apunta a la copia de tu depósito de almacenamiento multimodal
-
Metadatos de fecha y hora: se incluyen para los fragmentos de vídeo y audio para permitir un posicionamiento preciso de la reproducción
nota
Cuando utilices la API o el SDK, tendrás que gestionar la recuperación de archivos y la navegación con las marcas de tiempo en tu aplicación. La consola lo gestiona automáticamente con una reproducción de vídeo mejorada y una navegación automática con las marcas de tiempo.
-
nota
Si recibe un error que indica que la petición supera el límite de caracteres al generar las respuestas, puede acortarla de las siguientes maneras:
-
Reduzca el número máximo de resultados recuperados (de esta forma, se acorta lo que se rellena para el marcador de posición $search_results$ en las Plantillas de petición de la base de conocimiento: orquestación y generación).
-
Vuelva a crear el origen de datos con una estrategia de fragmentación que utilice fragmentos más pequeños (de este modo, se acorta lo que se rellena para el marcador de posición $search_results$ en las Plantillas de petición de la base de conocimiento: orquestación y generación).
-
Acorte la plantilla de la petición.
-
Acorte la consulta del usuario (esto acorta lo que se rellena para el marcador de posición $query$ en las Plantillas de petición de la base de conocimiento: orquestación y generación).