Solución de problemas: bases de conocimiento multimodales - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Solución de problemas: bases de conocimiento multimodales

Esta sección proporciona orientación para resolver los problemas más comunes que surgen al trabajar con bases de conocimiento multimodales. La información sobre la solución de problemas está organizada en función de las limitaciones generales, los escenarios de error más comunes, con sus causas y soluciones, y las recomendaciones de optimización del rendimiento. Utilice esta información para diagnosticar y resolver problemas durante la configuración, la ingesta o la consulta del contenido multimodal.

Limitaciones generales

Tenga en cuenta estas limitaciones actuales cuando trabaje con bases de conocimiento multimodales:

  • Límites de tamaño de archivo: 1,5 GB como máximo por archivo de vídeo, 1 GB por archivo de audio (Nova Multimodal Embeddings) o 1,5 GB por archivo (BDA)

  • Archivos por trabajo de ingestión: máximo 15 000 archivos por trabajo (Nova Multimodal Embeddings) o 1000 archivos por trabajo (BDA)

  • Límites de consultas: máximo una imagen por consulta

  • Restricciones de fuentes de datos: solo Amazon S3 y las fuentes de datos personalizadas admiten contenido multimodal

  • Limitaciones de fragmentación de BDA: cuando se utiliza Bedrock Data Automation con una segmentación de tamaño fijo, los ajustes de porcentaje de superposición no se aplican al contenido de audio y vídeo

  • Límites de trabajos simultáneos de BDA: límite predeterminado de 20 trabajos de BDA simultáneos. Para el procesamiento a gran escala, considere solicitar un aumento de la cuota de servicio

  • Limitaciones del modelo de reordenamiento: los modelos de reordenamiento no son compatibles con el contenido multimodal

  • Limitaciones de resumen: no se admite el resumen de las respuestas de recuperación que contienen contenido no textual

  • Limitaciones de entrada de consultas: actualmente no se admiten entradas que contengan texto e imagen. Puede utilizar consultas de texto o imágenes, pero no ambas a la vez.

  • Filtros de contenido de imagen de barandilla: cuando se utilizan consultas de imágenes con una barandilla que tiene filtros de contenido de imagen configurados, la imagen de entrada se evaluará comparándola con la barandilla y es posible que se bloquee si infringe los umbrales de filtro configurados

  • La entrada y el tipo no coinciden: de forma predeterminada, se asume que la entrada es texto cuando no se especifica el tipo. Cuando utilice modalidades distintas del texto, debe especificar el tipo correcto

Errores y soluciones comunes

Si tiene problemas con su base de conocimientos multimodal, revise estos escenarios comunes:

Error de 4 veces al utilizar consultas de imágenes.

Causa: se intenta utilizar consultas de imágenes con modelos de incrustación de solo texto o bases de conocimiento procesadas por BDA.

Solución: elija Amazon Nova Multimodal Embeddings al crear su base de conocimientos para la compatibilidad con las consultas de imágenes.

RAG devuelve un error de 4 veces mayor con contenido multimodal

Causa: se usa RetrieveAndGenerate con una base de conocimientos que contiene solo contenido multimodal y el modelo Amazon Nova Multimodal Embeddings.

Solución: utilice el analizador BDA para la funcionalidad RAG o asegúrese de que su base de conocimientos contenga contenido textual.

Error requerido en el destino del almacenamiento multimodal

Causa: uso de Nova Multimodal Embeddings sin configurar un destino de almacenamiento multimodal.

Solución: especifique un destino de almacenamiento multimodal cuando utilice Nova Multimodal Embeddings.

La fuente de datos y el almacenamiento multimodal utilizan el mismo depósito de S3

Causa: configurar la fuente de datos y el destino de almacenamiento multimodal para usar el mismo bucket de Amazon S3 sin los prefijos de inclusión adecuados.

Solución: utilice depósitos separados para la fuente de datos y el almacenamiento multimodal, o configure los prefijos de inclusión para evitar volver a ingerir los archivos multimedia extraídos.

El prefijo de inclusión no puede empezar por «aws/»

Causa: usar un prefijo de inclusión que comienza por «aws/» cuando la fuente de datos y el destino de almacenamiento multimodal comparten el mismo bucket de Amazon S3.

Solución: especifique un prefijo de inclusión diferente. La ruta «aws/» está reservada para el almacenamiento multimedia extraído y no se puede utilizar como prefijo de inclusión para evitar volver a ingerir el contenido procesado.

La ingestión de BDA omite el contenido multimodal

Causa: la base de conocimientos se creó sin un destino de almacenamiento multimodal y, a continuación, se agregó la fuente de datos BDA con contenido multimodal.

Solución: vuelva a crear la base de conocimientos con un destino de almacenamiento multimodal configurado para permitir el procesamiento BDA de archivos de audio, vídeo e imagen.

Base de conocimientos creada sin un modelo de incrustación multimodal

Causa: la base de conocimientos se creó con un modelo de incrustación de solo texto, lo que limita las capacidades multimodales.

Solución: cree una nueva base de conocimientos con Nova Multimodal Embeddings para permitir el procesamiento multimodal nativo y las consultas basadas en imágenes.

Gestión de datos transitorios con las políticas de ciclo de vida de Amazon S3

Al utilizar Nova Multimodal Embeddings, Amazon Bedrock almacena los datos transitorios en el destino de almacenamiento multimodal e intenta eliminarlos una vez finalizado el procesamiento. Recomendamos aplicar una política de ciclo de vida a la ruta de datos transitorios para garantizar que caduque correctamente.

Console
Para crear una regla de ciclo de vida mediante la consola
  1. Abra la consola de Amazon S3.

  2. Navegue hasta el destino de almacenamiento multimodal que ha configurado para su base de conocimientos.

  3. Elija la pestaña Administración y seleccione Crear regla de ciclo de vida.

  4. En el nombre de la regla de ciclo de vida, introduzcaTransient Data Deletion.

  5. En Tipo de filtro, elija Limitar el alcance de esta regla mediante uno o más filtros.

  6. En Prefijo, introduzca la ruta de datos transitoria para la base de conocimientos y la fuente de datos.

    Sustituya los valores de los marcadores de posición del siguiente prefijo por sus identificadores reales:

    aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data
    importante

    No aplique políticas de ciclo de vida a todo el segmento ni al prefijo «aws/», ya que esto eliminará el contenido multimodal y provocará errores en la recuperación. Utilice únicamente la ruta de datos transitorios específica que se muestra arriba.

  7. En Acciones de las reglas del ciclo de vida, selecciona Expirar las versiones actuales de los objetos.

  8. En Días después de la creación del objeto, introduzca1.

  9. Seleccione Creación de regla.

AWS CLI
Para crear una regla de ciclo de vida mediante el AWS CLI
  1. Cree un archivo JSON denominado lifecycle-policy.json con el siguiente contenido.

    Sustituya los valores de los marcadores de posición por sus identificadores reales:

    • knowledge-base-id- El identificador de su base de conocimientos

    • data-source-id- Su identificador de fuente de datos

    { "Rules": [ { "ID": "TransientDataDeletion", "Status": "Enabled", "Filter": { "Prefix": "aws/bedrock/knowledge_bases/knowledge-base-id/data-source-id/transient_data" }, "Expiration": { "Days": 1 } } ] }
  2. Aplique la política de ciclo de vida a su depósito. Sustituya your-multimodal-storage-bucket por el nombre real del bucket:

    aws s3api put-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket \ --lifecycle-configuration file://lifecycle-policy.json
  3. Compruebe que se haya aplicado la política de ciclo de vida:

    aws s3api get-bucket-lifecycle-configuration \ --bucket your-multimodal-storage-bucket

Para obtener más información sobre las políticas del ciclo de vida de Amazon S3, consulte Administrar el ciclo de vida de los objetos en la Guía del usuario de Amazon S3.

Consideraciones sobre el rendimiento

Para obtener un rendimiento óptimo con su base de conocimientos multimodal, tenga en cuenta los siguientes factores:

  • Tiempo de procesamiento: el procesamiento de BDA tarda más debido a la conversión del contenido

  • Latencia de consulta: las consultas de imágenes pueden tener una latencia mayor que las consultas de texto

  • Duración de la fragmentación: las duraciones más largas de los fragmentos de audio/vídeo aumentan el tiempo de procesamiento, pero pueden mejorar la precisión