Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
TwelveLabs Marengo Embed 2.7
Le TwelveLabs Marengo Embed 2.7 modèle génère des intégrations à partir d'entrées vidéo, texte, audio ou image. Ces intégrations peuvent être utilisées pour la recherche de similarités, le clustering et d'autres tâches d'apprentissage automatique. Le modèle prend en charge l'inférence asynchrone via l'API. StartAsyncInvoke
Fournisseur — TwelveLabs
Catégories — Embeddings multimodaux
Identifiant du modèle —
twelvelabs.marengo-embed-2-7-v1:0
Modalité de saisie : vidéo, texte, audio, image
Modalité de sortie — Embeddings
Taille vidéo maximale : vidéo de 2 heures (taille de fichier inférieure à 2 Go)
TwelveLabs Marengo Embed 2.7paramètres de demande
Le tableau suivant décrit les paramètres d'entrée du TwelveLabs Marengo Embed 2.7 modèle :
Champ | Type | Obligatoire | Description |
---|---|---|---|
inputType |
chaîne | Oui | Modalité d'intégration. Valeurs valides: video , text , audio , image . |
inputText |
chaîne | Non | Texte à intégrer quand c'inputType est le castext . Obligatoire si inputType a pour valeur text . La saisie de texte n'est pas disponible par l'URI S3 mais uniquement par le inputText champ. |
startSec |
double | Non | Le décalage de début en secondes par rapport au début de la vidéo ou de l'audio où le traitement doit commencer. Spécifier 0 signifie commencer depuis le début du média. Par défaut : 0, Minimum : 0. |
lengthSec |
double | Non | Durée en secondes de la vidéo ou du son d'origine du traitementstartSec . Par défaut : durée du média, Max : durée du média. |
useFixedLengthSec |
double | Non | Pour les video entrées audio ou uniquement. Durée fixe souhaitée en secondes pour chaque clip pour lequel la plateforme génère une intégration. Minimum : 2, maximum : 10. En cas d'absence, pour la vidéo : les segments sont divisés dynamiquement par détection des limites de prise de vue ; pour le son, les segments sont divisés de manière égale à 10 secondes au plus près (donc, s'il s'agit d'un clip de 50 secondes, il y aura 5 segments de 10 secondes chacun, mais s'il s'agit d'un clip de 16 secondes, il y aura 2 segments de 8 secondes chacun). |
textTruncate |
chaîne | Non | Pour text entrée uniquement. Spécifie la manière dont la plateforme tronque le texte qui dépasse 77 jetons. Valeurs valides : end (tronquer la fin du texte), none (renvoie une erreur si le texte dépasse la limite). Par défaut: end . |
embeddingOption |
liste | Non | Pour video entrée uniquement. Spécifie les types d'intégrations à récupérer. Valeurs valides : visual-text (intégrations visuelles optimisées pour la recherche de texte), visual-image (intégrations visuelles optimisées pour la recherche d'images), (intégrations audio). audio Si elles ne sont pas fournies, toutes les intégrations disponibles sont renvoyées. |
mediaSource |
objet | Non | Décrit la source multimédia. Obligatoire pour les types d'entrée : image video , etaudio . |
mediaSource.base64String |
chaîne | Non | Chaîne d'octets codée en Base64 pour le média. Maximum : 36 Mo. L'un base64String ou l'autre s3Location doit être fourni s'mediaSource il est utilisé. |
mediaSource.s3Location.uri |
chaîne | Non | URI S3 à partir duquel le contenu multimédia peut être téléchargé. Pour les vidéos, durée maximale : 2 heures (taille de fichier inférieure à 2 Go). Obligatoire en cas d'utilisations3Location . |
mediaSource.s3Location.bucketOwner |
chaîne | Non | ID de compte AWS du propriétaire du compartiment. |
minClipSec |
int | Non | Pour video entrée uniquement. Définissez une seconde de clip minimale. Remarque : useFixedLengthSec doit être supérieure à cette valeur. Par défaut : 4, min : 1, max : 5. |
TwelveLabs Marengo Embed 2.7 Champs de réponse
Le tableau suivant décrit les champs de sortie du TwelveLabs Marengo Embed 2.7 modèle :
Champ | Type | Description |
---|---|---|
embedding |
Liste des chambres doubles | Intégrer des valeurs |
embeddingOption |
chaîne | Type d'intégration pour la sortie multivectorielle (applicable uniquement pour la vidéo). Valeurs valides : visual-text (intégrations visuelles étroitement alignées sur les incorporations de texte), (intégrations visuelles étroitement alignées sur les incorporations d'images), visual-image (incorporations audio). audio |
startSec |
double | Le décalage de départ du clip. Non applicable aux intégrations de texte et d'images. |
endSec |
double | Le décalage final du clip. Non applicable aux intégrations de texte et d'images. |
TwelveLabs Marengo Embed 2.7demande et réponse
Les exemples suivants montrent comment utiliser le TwelveLabs Marengo Embed 2.7 modèle avec différents types d'entrée. Notez qu'il TwelveLabs Marengo Embed 2.7 utilise l' StartAsyncInvoke API pour le traitement.