Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Modelos de TwelveLabs
En esta sección se describen los parámetros de solicitud y los campos de respuesta de los modelos de TwelveLabs. Utilice esta información para realizar llamadas de inferencia a los modelos. TwelveLabs El TwelveLabs Pegasus 1.2 modelo admite InvokeModellas operaciones InvokeModelWithResponseStream(de transmisión), mientras que el TwelveLabs Marengo Embed 2.7 modelo admite StartAsyncInvokelas operaciones. Esta sección también incluye ejemplos de código que muestran cómo llamar a TwelveLabs los modelos. Para utilizar un modelo en una operación de inferencia, necesitará el ID del modelo. Para obtener el ID del modelo, consulte Modelos fundacionales compatibles en Amazon Bedrock.
TwelveLabses un proveedor líder de modelos de IA multimodales que se especializa en la comprensión y el análisis de vídeos. Sus modelos avanzados permiten capacidades sofisticadas de búsqueda, análisis y generación de contenido de vídeo mediante tecnologías de visión state-of-the-art artificial y procesamiento del lenguaje natural. Amazon Bedrock ofrece ahora dos TwelveLabs modelos: TwelveLabs Pegasus 1.2 el que proporciona una comprensión y un análisis integrales del vídeo y TwelveLabs Marengo Embed 2.7 el que genera incrustaciones de alta calidad para contenido de vídeo, texto, audio e imágenes. Estos modelos permiten a los desarrolladores crear aplicaciones que pueden procesar, analizar y obtener información a partir de datos de vídeo a gran escala de forma inteligente.
TwelveLabs Pegasus 1.2
Un modelo multimodal que proporciona capacidades integrales de comprensión y análisis del vídeo, que incluyen el reconocimiento de contenido, la detección de escenas y la comprensión del contexto. El modelo puede analizar el contenido del vídeo y generar descripciones textuales, información y respuestas a preguntas sobre el vídeo.
TwelveLabs Marengo Embed 2.7
Un modelo de incrustación multimodal que genera representaciones vectoriales de alta calidad del contenido de vídeo, texto, audio e imágenes para la búsqueda de similitudes, la agrupación en clústeres y otras tareas de aprendizaje automático. El modelo admite múltiples modalidades de entrada y proporciona incrustaciones especializadas optimizadas para diferentes casos de uso.
En la siguiente tabla se enumeran los TwelveLabs modelos disponibles en Amazon Bedrock.
Nombre de modelo | ID del modelo | Modalidad de entrada | Modalidad de salida | Descripción |
---|---|---|---|---|
TwelveLabs Pegasus 1.2 | doce laboratorios. Pegasus-1-2-v 1:0 | Video | Texto | Un modelo multimodal que proporciona capacidades integrales de comprensión y análisis de vídeo, que incluyen el reconocimiento de contenido, la detección de escenas y la comprensión contextual. |
TwelveLabs Marengo Embed 2.7 | twelvelabs.marengo-embed-2-7-v 1:0 | Vídeo, texto, audio, imagen | Incrustaciones | Un modelo de incrustación multimodal que genera representaciones vectoriales de alta calidad del contenido de vídeo, texto, audio e imágenes para la búsqueda de similitudes, la agrupación en clústeres y otras tareas de aprendizaje automático. |