As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
TwelveLabs Marengo Embed 2.7
O TwelveLabs Marengo Embed 2.7 modelo gera incorporações a partir de entradas de vídeo, texto, áudio ou imagem. Essas incorporações podem ser usadas para pesquisa por similaridade, agrupamento e outras tarefas de aprendizado de máquina. O modelo oferece suporte à inferência assíncrona por meio da API. StartAsyncInvoke
Fornecedor — TwelveLabs
Categorias — Incorporações, multimodais
ID do modelo —
twelvelabs.marengo-embed-2-7-v1:0
Modalidade de entrada — Vídeo, Texto, Áudio, Imagem
Modalidade de saída — Incorporações
Tamanho máximo do vídeo — vídeo de 2 horas (tamanho de arquivo < 2GB)
TwelveLabs Marengo Embed 2.7parâmetros de solicitação
A tabela a seguir descreve os parâmetros de entrada para o TwelveLabs Marengo Embed 2.7 modelo:
Campo | Tipo | Obrigatório | Descrição |
---|---|---|---|
inputType |
string | Sim | Modalidade para a incorporação. Valores válidos: video , text , audio , image . |
inputText |
string | Não | Texto a ser incorporado quando inputType estivertext . Obrigatório se inputType for text . A entrada de texto não está disponível pelo URI do S3, mas somente pelo inputText campo. |
startSec |
double | Não | O deslocamento inicial em segundos do início do vídeo ou áudio em que o processamento deve começar. Especificar 0 significa começar do início da mídia. Padrão: 0, Min: 0. |
lengthSec |
double | Não | A duração, em segundos, do vídeo ou áudio de onde o processamento seria realizadostartSec . Padrão: duração da mídia, Máximo: duração da mídia. |
useFixedLengthSec |
double | Não | Somente para audio ou para video entradas. A duração fixa desejada em segundos para cada clipe para o qual a plataforma gera uma incorporação. Mín: 2, Máx.: 10. Se faltar, para vídeo: os segmentos são divididos dinamicamente pela detecção do limite de captura; para áudio: os segmentos são divididos uniformemente para ficarem mais próximos de 10 segundos (então, se for um clipe de 50 segundos, serão 5 segmentos com 10 segundos cada, mas se for um clipe de 16 segundos, serão 2 segmentos de 8 segundos cada). |
textTruncate |
string | Não | Somente para text entrada. Especifica como a plataforma trunca o texto que excede 77 tokens. Valores válidos: end (truncar o final do texto), none (retornar um erro se o texto exceder o limite). Padrão: end . |
embeddingOption |
list | Não | Somente para video entrada. Especifica quais tipos de incorporações devem ser recuperadas. Valores válidos: visual-text (incorporações visuais otimizadas para pesquisa de texto), visual-image (incorporações visuais otimizadas para pesquisa de imagens), audio (incorporações de áudio). Se não for fornecido, todas as incorporações disponíveis serão retornadas. |
mediaSource |
objeto | Não | Descreve a fonte de mídia. Obrigatório para os tipos de entrada: image video , audio e. |
mediaSource.base64String |
string | Não | Cadeia de bytes codificada em Base64 para a mídia. Máximo: 36 MB. Um base64String ou s3Location deve ser fornecido se mediaSource for usado. |
mediaSource.s3Location.uri |
string | Não | URI do S3 de onde a mídia pode ser baixada. Para vídeo, no máximo: 2 horas de duração (tamanho de arquivo < 2 GB). Necessário se estiver usandos3Location . |
mediaSource.s3Location.bucketOwner |
string | Não | ID da conta da AWS do proprietário do bucket. |
minClipSec |
int | Não | Somente para video entrada. Defina um segundo mínimo de clipe. Nota: useFixedLengthSec deve ser maior que esse valor. Padrão: 4, Mín: 1, Máx: 5. |
Campos de resposta TwelveLabs Marengo Embed 2.7
A tabela a seguir descreve os campos de saída do TwelveLabs Marengo Embed 2.7 modelo:
Campo | Tipo | Descrição |
---|---|---|
embedding |
Lista de duplas | Valores de incorporação |
embeddingOption |
string | O tipo de incorporação para saída de vários vetores (aplicável somente para vídeo). Valores válidos: visual-text (incorporações visuais estreitamente alinhadas com incorporações de texto), visual-image (incorporações visuais estreitamente alinhadas com incorporações de imagem), (incorporações de áudio). audio |
startSec |
double | O deslocamento inicial do clipe. Não aplicável para incorporações de texto e imagem. |
endSec |
double | O deslocamento final do clipe. Não aplicável para incorporações de texto e imagem. |
TwelveLabs Marengo Embed 2.7solicitação e resposta
Os exemplos a seguir mostram como usar o TwelveLabs Marengo Embed 2.7 modelo com diferentes tipos de entrada. Observe que TwelveLabs Marengo Embed 2.7 usa a StartAsyncInvoke API para processamento.