TwelveLabs Marengo Embed 2.7 - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

TwelveLabs Marengo Embed 2.7

TwelveLabs Marengo Embed 2.7Model menghasilkan embeddings dari video, teks, audio, atau input gambar. Embeddings ini dapat digunakan untuk pencarian kesamaan, pengelompokan, dan tugas pembelajaran mesin lainnya. Model ini mendukung inferensi asinkron melalui API. StartAsyncInvoke

  • Penyedia — TwelveLabs

  • Kategori — Embeddings, multimodal

  • ID Model — twelvelabs.marengo-embed-2-7-v1:0

  • Modalitas masukan - Video, Teks, Audio, Gambar

  • Modalitas keluaran - Embeddings

  • Ukuran video maksimal - video berdurasi 2 jam (<ukuran file 2GB)

TwelveLabs Marengo Embed 2.7parameter permintaan

Tabel berikut menjelaskan parameter input untuk TwelveLabs Marengo Embed 2.7 model:

TwelveLabs Marengo Embed 2.7parameter permintaan
Bidang Tipe Diperlukan Deskripsi
inputType string Ya Modalitas untuk penyematan. Nilai yang valid:video,text,audio,image.
inputText string Tidak Teks yang akan inputType disematkan kapantext. Diperlukan jika inputType adalah text. Input teks tidak tersedia oleh URI S3 tetapi hanya oleh inputText bidang.
startSec double Tidak Mulai offset dalam hitungan detik dari awal video atau audio di mana pemrosesan harus dimulai. Menentukan 0 berarti mulai dari awal media. Default: 0, Min: 0.
lengthSec double Tidak Panjang dalam detik video atau audio tempat pemrosesan akan diambilstartSec. Default: durasi media, Maks: durasi media.
useFixedLengthSec double Tidak Untuk audio atau video input saja. Durasi tetap yang diinginkan dalam hitungan detik untuk setiap klip tempat platform menghasilkan penyematan. Min: 2, Maks: 10. Jika hilang, untuk video: segmen dibagi secara dinamis dengan deteksi batas bidikan; untuk audio: segmen dibagi secara merata agar paling dekat dengan 10 detik (jadi jika itu adalah klip 50 detik maka itu akan menjadi 5 segmen dengan masing-masing 10 detik, tetapi jika itu adalah klip 16 detik, itu akan menjadi 2 segmen masing-masing 8 detik).
textTruncate string Tidak Hanya untuk text masukan. Menentukan bagaimana platform memotong teks yang melebihi 77 token. Nilai yang valid: end (memotong akhir teks), none (mengembalikan kesalahan jika teks melebihi batas). Default: end.
embeddingOption daftar Tidak Hanya untuk video masukan. Menentukan jenis embeddings untuk mengambil. Nilai yang valid: visual-text (penyematan visual yang dioptimalkan untuk pencarian teks), visual-image (penyematan visual yang dioptimalkan untuk pencarian gambar), (penyematan audio). audio Jika tidak disediakan, semua embeddings yang tersedia dikembalikan.
mediaSource object Tidak Menjelaskan sumber media. Diperlukan untuk jenis input:image,video, danaudio.
mediaSource.base64String string Tidak Base64 dikodekan string byte untuk media. Maks: 36MB. Entah base64String atau s3Location harus disediakan jika mediaSource digunakan.
mediaSource.s3Location.uri string Tidak S3 URI tempat media dapat diunduh. Untuk video, maks: 2 jam (<ukuran file 2GB). Diperlukan jika menggunakans3Location.
mediaSource.s3Location.bucketOwner string Tidak ID akun AWS dari pemilik bucket.
minClipSec int Tidak Hanya untuk video masukan. Tetapkan klip minimum detik. Catatan: useFixedLengthSec harus lebih besar dari nilai ini. Default: 4, Min: 1, Maks: 5.

TwelveLabs Marengo Embed 2.7 bidang respons

Tabel berikut menjelaskan bidang output untuk TwelveLabs Marengo Embed 2.7 model:

TwelveLabs Marengo Embed 2.7 bidang respons
Bidang Tipe Deskripsi
embedding Daftar ganda Menyematkan nilai
embeddingOption string Jenis embeddings untuk output multi-vektor (hanya berlaku untuk video). Nilai yang valid: visual-text (penyematan visual yang selaras erat dengan penyematan teks), (penyematan visual yang selaras erat dengan penyematan gambar), visual-image (penyematan audio). audio
startSec double Offset awal klip. Tidak berlaku untuk penyematan teks dan gambar.
endSec double Offset akhir klip. Tidak berlaku untuk penyematan teks dan gambar.

TwelveLabs Marengo Embed 2.7permintaan dan tanggapan

Contoh berikut menunjukkan cara menggunakan TwelveLabs Marengo Embed 2.7 model dengan tipe input yang berbeda. Perhatikan bahwa TwelveLabs Marengo Embed 2.7 menggunakan StartAsyncInvoke API untuk diproses.

Request

Contoh berikut menunjukkan format permintaan untuk TwelveLabs Marengo Embed 2.7 model yang menggunakan StartAsyncInvoke API.

Masukan teks:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "text", "inputText": "Spiderman flies through a street and catches a car with his web" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Input gambar dengan lokasi S3:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "image", "mediaSource": { "s3Location": { "uri": "s3://your-image-object-s3-path", "bucketOwner": "your-image-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Input gambar dengan pengkodean base64:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "image", "mediaSource": { "base64String": "base_64_encoded_string_of_image" } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Masukan video dengan lokasi S3:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "video", "mediaSource": { "s3Location": { "uri": "s3://your-video-object-s3-path", "bucketOwner": "your-video-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Masukan video dengan pengkodean base64 dan rentang waktu:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "video", "mediaSource": { "base64String": "base_64_encoded_string_of_video" }, "startSec": 0, "lengthSec": 13, "useFixedLengthSec": 5, "embeddingOption": ["visual-text", "audio"] }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Input audio dengan lokasi S3:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "audio", "mediaSource": { "s3Location": { "uri": "s3://your-audio-object-s3-path", "bucketOwner": "your-audio-object-s3-bucket-owner-account" } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Input audio dengan pengkodean base64 dan rentang waktu:

{ "modelId": "twelvelabs.marengo-embed-2-7-v1:0", "modelInput": { "inputType": "audio", "mediaSource": { "base64String": "base_64_encoded_string_of_audio" }, "startSec": 0, "lengthSec": 13, "useFixedLengthSec": 10 }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Response

Contoh berikut menunjukkan format respons dari TwelveLabs Marengo Embed 2.7 model. Karena model ini digunakan StartAsyncInvoke, respons dikirim ke Lokasi Output S3 yang ditentukan dioutputDataConfig.

Respons penyematan teks:

{ "embedding": [0.123, -0.456, 0.789, ...], "embeddingOption": null, "startSec": null, "endSec": null }

Respons penyematan gambar:

{ "embedding": [0.234, -0.567, 0.890, ...], "embeddingOption": null, "startSec": null, "endSec": null }

Respons penyematan video (klip tunggal):

{ "embedding": [0.345, -0.678, 0.901, ...], "embeddingOption": "visual-text", "startSec": 0.0, "endSec": 5.0 }

Respons penyematan video (beberapa klip dengan jenis penyematan berbeda):

[ { "embedding": [0.123, -0.456, 0.789, ...], "embeddingOption": "visual-text", "startSec": 0.0, "endSec": 5.0 }, { "embedding": [0.234, -0.567, 0.890, ...], "embeddingOption": "visual-text", "startSec": 5.0, "endSec": 10.0 }, { "embedding": [0.345, -0.678, 0.901, ...], "embeddingOption": "audio", "startSec": 0.0, "endSec": 10.0 } ]

Respons penyematan audio (beberapa klip):

[ { "embedding": [0.456, -0.789, 0.012, ...], "embeddingOption": null, "startSec": 0.0, "endSec": 10.0 }, { "embedding": [0.567, -0.890, 0.123, ...], "embeddingOption": null, "startSec": 10.0, "endSec": 13.0 } ]