翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
TwelveLabs Marengo Embed 2.7
TwelveLabs Marengo Embed 2.7 モデルは、動画、テキスト、オーディオ、または画像入力から埋め込みを生成します。これらの埋め込みは、類似度検索、クラスタリング、その他の機械学習タスクに使用できます。このモデルは、 StartAsyncInvoke
API を介した非同期推論をサポートしています。
プロバイダー — TwelveLabs
カテゴリ — 埋め込み、マルチモーダル
モデル ID —
twelvelabs.marengo-embed-2-7-v1:0
入力モダリティ — 動画、テキスト、オーディオ、イメージ
出力モダリティ — 埋め込み
最大ビデオサイズ — 2 時間の長さのビデオ (< 2GB ファイルサイズ)
TwelveLabs Marengo Embed 2.7 リクエストパラメータ
次の表に、TwelveLabs Marengo Embed 2.7モデルの入力パラメータを示します。
フィールド | Type | 必須 | 説明 |
---|---|---|---|
inputType |
文字列 | はい | 埋め込みのモダリティ。有効な値は、video 、text 、audio 、image です。 |
inputText |
文字列 | いいえ | inputType が の場合に埋め込まれるテキストtext 。inputType が text の場合は必須です。テキスト入力は S3 URI では使用できませんが、 inputText フィールドでのみ使用できます。 |
startSec |
double | いいえ | 処理を開始するビデオまたはオーディオの開始からの秒単位の開始オフセット。0 を指定すると、メディアの先頭から開始されます。デフォルト: 0、最小: 0。 |
lengthSec |
double | いいえ | 処理が から行われるビデオまたはオーディオの秒単位の長さstartSec 。デフォルト: メディア期間、最大: メディア期間。 |
useFixedLengthSec |
double | いいえ | audio または video 入力のみ。プラットフォームが埋め込みを生成するクリップごとに必要な固定時間を秒単位で表します。最小: 2、最大: 10。ビデオの場合、セグメントはショット境界検出によって動的に分割されます。オーディオの場合、セグメントは 10 秒に最も近いように均等に分割されます (つまり、50 秒のクリップの場合、それぞれ 10 秒で 5 セグメントになりますが、16 秒のクリップの場合、それぞれ 8 秒で 2 セグメントになります)。 |
textTruncate |
文字列 | いいえ | text 入力のみ。プラットフォームが 77 トークンを超えるテキストを切り捨てる方法を指定します。有効な値: end (テキストの末尾を切り捨てる)、 none (テキストが制限を超えた場合はエラーを返します)。デフォルト: end 。 |
embeddingOption |
リスト | いいえ | video 入力のみ。取得する埋め込みのタイプを指定します。有効な値: visual-text (テキスト検索用に最適化されたビジュアル埋め込み)、 visual-image (イメージ検索用に最適化されたビジュアル埋め込み)、 audio (オーディオ埋め込み)。指定しない場合、使用可能なすべての埋め込みが返されます。 |
mediaSource |
オブジェクト | いいえ | メディアソースについて説明します。入力タイプに必要です: image 、video 、および audio 。 |
mediaSource.base64String |
文字列 | いいえ | メディアの Base64 エンコードされたバイト文字列。最大: 36MB。を使用する場合は、 base64String または mediaSource を指定s3Location する必要があります。 |
mediaSource.s3Location.uri |
文字列 | いいえ | メディアをダウンロードできる S3 URI。動画の場合、最大: 2 時間 (< 2GB ファイルサイズ)。を使用する場合は必須ですs3Location 。 |
mediaSource.s3Location.bucketOwner |
文字列 | いいえ | バケット所有者の AWS アカウント ID。 |
minClipSec |
int | いいえ | video 入力のみ。最小クリップ秒を設定します。注: はこの値より大きいuseFixedLengthSec 必要があります。デフォルト: 4、最小: 1、最大: 5。 |
TwelveLabs Marengo Embed 2.7 応答フィールド
次の表に、TwelveLabs Marengo Embed 2.7モデルの出力フィールドを示します。
フィールド | タイプ | 説明 |
---|---|---|
embedding |
倍精度のリスト | 値の埋め込み |
embeddingOption |
文字列 | マルチベクトル出力の埋め込みのタイプ (ビデオにのみ適用されます)。有効な値: visual-text (テキスト埋め込みと密接に整列したビジュアル埋め込み)、 visual-image (イメージ埋め込みと密接に整列したビジュアル埋め込み)、 audio (オーディオ埋め込み)。 |
startSec |
double | クリップの開始オフセット。テキストとイメージの埋め込みには適用されません。 |
endSec |
double | クリップの終了オフセット。テキストとイメージの埋め込みには適用されません。 |
TwelveLabs Marengo Embed 2.7 リクエストとレスポンス
次の例は、さまざまな入力タイプでTwelveLabs Marengo Embed 2.7モデルを使用する方法を示しています。は処理に StartAsyncInvoke API TwelveLabs Marengo Embed 2.7を使用することに注意してください。