TwelveLabs Marengo Embed 2.7 - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

TwelveLabs Marengo Embed 2.7

TwelveLabs Marengo Embed 2.7 モデルは、動画、テキスト、オーディオ、または画像入力から埋め込みを生成します。これらの埋め込みは、類似度検索、クラスタリング、その他の機械学習タスクに使用できます。このモデルは、 StartAsyncInvoke API を介した非同期推論をサポートしています。

  • プロバイダー — TwelveLabs

  • カテゴリ — 埋め込み、マルチモーダル

  • モデル ID — twelvelabs.marengo-embed-2-7-v1:0

  • 入力モダリティ — 動画、テキスト、オーディオ、イメージ

  • 出力モダリティ — 埋め込み

  • 最大ビデオサイズ — 2 時間の長さのビデオ (< 2GB ファイルサイズ)

TwelveLabs Marengo Embed 2.7 リクエストパラメータ

次の表に、TwelveLabs Marengo Embed 2.7モデルの入力パラメータを示します。

TwelveLabs Marengo Embed 2.7 リクエストパラメータ
フィールド Type 必須 説明
inputType 文字列 はい 埋め込みのモダリティ。有効な値は、videotextaudioimage です。
inputText 文字列 いいえ inputType が の場合に埋め込まれるテキストtextinputTypetext の場合は必須です。テキスト入力は S3 URI では使用できませんが、 inputTextフィールドでのみ使用できます。
startSec double いいえ 処理を開始するビデオまたはオーディオの開始からの秒単位の開始オフセット。0 を指定すると、メディアの先頭から開始されます。デフォルト: 0、最小: 0。
lengthSec double いいえ 処理が から行われるビデオまたはオーディオの秒単位の長さstartSec。デフォルト: メディア期間、最大: メディア期間。
useFixedLengthSec double いいえ audio または video入力のみ。プラットフォームが埋め込みを生成するクリップごとに必要な固定時間を秒単位で表します。最小: 2、最大: 10。ビデオの場合、セグメントはショット境界検出によって動的に分割されます。オーディオの場合、セグメントは 10 秒に最も近いように均等に分割されます (つまり、50 秒のクリップの場合、それぞれ 10 秒で 5 セグメントになりますが、16 秒のクリップの場合、それぞれ 8 秒で 2 セグメントになります)。
textTruncate 文字列 いいえ text 入力のみ。プラットフォームが 77 トークンを超えるテキストを切り捨てる方法を指定します。有効な値: end (テキストの末尾を切り捨てる)、 none (テキストが制限を超えた場合はエラーを返します)。デフォルト: end
embeddingOption リスト いいえ video 入力のみ。取得する埋め込みのタイプを指定します。有効な値: visual-text (テキスト検索用に最適化されたビジュアル埋め込み)、 visual-image (イメージ検索用に最適化されたビジュアル埋め込み)、 audio (オーディオ埋め込み)。指定しない場合、使用可能なすべての埋め込みが返されます。
mediaSource オブジェクト いいえ メディアソースについて説明します。入力タイプに必要です: imagevideo、および audio
mediaSource.base64String 文字列 いいえ メディアの Base64 エンコードされたバイト文字列。最大: 36MB。を使用する場合は、 base64Stringまたは mediaSource を指定s3Locationする必要があります。
mediaSource.s3Location.uri 文字列 いいえ メディアをダウンロードできる S3 URI。動画の場合、最大: 2 時間 (< 2GB ファイルサイズ)。を使用する場合は必須ですs3Location
mediaSource.s3Location.bucketOwner 文字列 いいえ バケット所有者の AWS アカウント ID。
minClipSec int いいえ video 入力のみ。最小クリップ秒を設定します。注: はこの値より大きいuseFixedLengthSec必要があります。デフォルト: 4、最小: 1、最大: 5。

TwelveLabs Marengo Embed 2.7 応答フィールド

次の表に、TwelveLabs Marengo Embed 2.7モデルの出力フィールドを示します。

TwelveLabs Marengo Embed 2.7 応答フィールド
フィールド タイプ 説明
embedding 倍精度のリスト 値の埋め込み
embeddingOption 文字列 マルチベクトル出力の埋め込みのタイプ (ビデオにのみ適用されます)。有効な値: visual-text (テキスト埋め込みと密接に整列したビジュアル埋め込み)、 visual-image (イメージ埋め込みと密接に整列したビジュアル埋め込み)、 audio (オーディオ埋め込み)。
startSec double クリップの開始オフセット。テキストとイメージの埋め込みには適用されません。
endSec double クリップの終了オフセット。テキストとイメージの埋め込みには適用されません。

TwelveLabs Marengo Embed 2.7 リクエストとレスポンス

次の例は、さまざまな入力タイプでTwelveLabs Marengo Embed 2.7モデルを使用する方法を示しています。は処理に StartAsyncInvoke API TwelveLabs Marengo Embed 2.7を使用することに注意してください。

Request

次の例は、StartAsyncInvoke API を使用したTwelveLabs Marengo Embed 2.7モデルのリクエスト形式を示しています。

テキスト入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "text", "inputText": "Spiderman flies through a street and catches a car with his web" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

S3 ロケーションでのイメージ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "image", "mediaSource": { "s3Location": { "uri": "s3://your-image-object-s3-path", "bucketOwner": "your-image-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

base64 エンコーディングによるイメージ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "image", "mediaSource": { "base64String": "base_64_encoded_string_of_image" } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

S3 ロケーションでのビデオ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "video", "mediaSource": { "s3Location": { "uri": "s3://your-video-object-s3-path", "bucketOwner": "your-video-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

base64 エンコードと時間範囲を使用したビデオ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "video", "mediaSource": { "base64String": "base_64_encoded_string_of_video" }, "startSec": 0, "lengthSec": 13, "useFixedLengthSec": 5, "embeddingOption": ["visual-text", "audio"] }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

S3 ロケーションでのオーディオ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "audio", "mediaSource": { "s3Location": { "uri": "s3://your-audio-object-s3-path", "bucketOwner": "your-audio-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

base64 エンコードと時間範囲を使用したオーディオ入力:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "audio", "mediaSource": { "base64String": "base_64_encoded_string_of_audio" }, "startSec": 0, "lengthSec": 13, "useFixedLengthSec": 10 }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Response

次の例は、TwelveLabs Marengo Embed 2.7モデルからのレスポンス形式を示しています。このモデルは StartAsyncInvoke を使用するため、レスポンスは の指定された S3 出力場所に配信されますoutputDataConfig

テキスト埋め込みレスポンス:

{ "embedding": [0.123, -0.456, 0.789, ...], "embeddingOption": null, "startSec": null, "endSec": null }

イメージ埋め込みレスポンス:

{ "embedding": [0.234, -0.567, 0.890, ...], "embeddingOption": null, "startSec": null, "endSec": null }

動画埋め込みレスポンス (シングルクリップ):

{ "embedding": [0.345, -0.678, 0.901, ...], "embeddingOption": "visual-text", "startSec": 0.0, "endSec": 5.0 }

動画埋め込みレスポンス (埋め込みタイプが異なる複数のクリップ):

[ { "embedding": [0.123, -0.456, 0.789, ...], "embeddingOption": "visual-text", "startSec": 0.0, "endSec": 5.0 }, { "embedding": [0.234, -0.567, 0.890, ...], "embeddingOption": "visual-text", "startSec": 5.0, "endSec": 10.0 }, { "embedding": [0.345, -0.678, 0.901, ...], "embeddingOption": "audio", "startSec": 0.0, "endSec": 10.0 } ]

オーディオ埋め込みレスポンス (複数のクリップ):

[ { "embedding": [0.456, -0.789, 0.012, ...], "embeddingOption": null, "startSec": 0.0, "endSec": 10.0 }, { "embedding": [0.567, -0.890, 0.123, ...], "embeddingOption": null, "startSec": 10.0, "endSec": 13.0 } ]