TwelveLabsModelos de - Amazon Bedrock

TwelveLabsModelos de

En esta sección se describen los parámetros de solicitud y los campos de respuesta de los modelos de TwelveLabs. Utilice esta información para realizar llamadas de inferencia a los modelos de TwelveLabs. El modelo TwelveLabs Pegasus 1.2 admite las operaciones InvokeModel e InvokeModelWithResponseStream (transmisión), mientras que el modelo TwelveLabs Marengo Embed 2.7 admite las operaciones StartAsyncInvoke. En esta sección también se incluyen ejemplos de código que muestran cómo llamar a los modelos de TwelveLabs. Para utilizar un modelo en una operación de inferencia, necesitará el ID del modelo. Para obtener el ID del modelo, consulte Modelos fundacionales compatibles en Amazon Bedrock.

TwelveLabs es un proveedor líder de modelos de IA multimodales especializado en la comprensión y el análisis de vídeo. Sus modelos avanzados permiten capacidades sofisticadas de búsqueda, análisis y generación de contenido de vídeo a través de tecnologías de visión artificial y procesamiento del lenguaje natural de última generación. Amazon Bedrock ofrece ahora dos modelos de TwelveLabs: TwelveLabs Pegasus 1.2, que proporciona comprensión y análisis integrales de vídeo, y TwelveLabs Marengo Embed 2.7, que genera incrustaciones de alta calidad para contenido de vídeo, texto, audio e imágenes. Estos modelos permiten a los desarrolladores crear aplicaciones que pueden procesar, analizar y obtener información a partir de datos de vídeo a gran escala de forma inteligente.

TwelveLabs Pegasus 1.2

Un modelo multimodal que proporciona capacidades integrales de comprensión y análisis de vídeo, incluido el reconocimiento de contenido, la detección de escenas y la comprensión del contexto. El modelo puede analizar el contenido de vídeo y generar descripciones textuales, información y respuestas a preguntas sobre el vídeo.

TwelveLabs Marengo Embed 2.7

Un modelo de incrustación multimodal que genera representaciones vectoriales de alta calidad del contenido de vídeo, texto, audio e imágenes para la búsqueda de similitudes, la agrupación en clústeres y otras tareas de machine learning. El modelo admite varias modalidades de entrada y proporciona incrustaciones especializadas optimizadas para diferentes casos de uso.