Permintaan penyematan lengkap dan skema respons - Amazon Nova

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Permintaan penyematan lengkap dan skema respons

Skema sinkron lengkap

{ "schemaVersion": "nova-multimodal-embed-v1", "taskType": "SINGLE_EMBEDDING", "singleEmbeddingParams": { "embeddingPurpose": "GENERIC_INDEX" | "GENERIC_RETRIEVAL" | "TEXT_RETRIEVAL" | "IMAGE_RETRIEVAL" | "VIDEO_RETRIEVAL" | "DOCUMENT_RETRIEVAL" | "AUDIO_RETRIEVAL" | "CLASSIFICATION" | "CLUSTERING", "embeddingDimension": 256 | 384 | 1024 | 3072, "text": { "truncationMode": "START" | "END" | "NONE", "value": string, "source": SourceObject, }, "image": { "detailLevel": "STANDARD_IMAGE" | "DOCUMENT_IMAGE", "format": "png" | "jpeg" | "gif" | "webp", "source": SourceObject }, "audio": { "format": "mp3" | "wav" | "ogg", "source": SourceObject }, "video": { "format": "mp4" | "mov" | "mkv" | "webm" | "flv" | "mpeg" | "mpg" | "wmv" | "3gp", "source": SourceObject, "embeddingMode": "AUDIO_VIDEO_COMBINED" | "AUDIO_VIDEO_SEPARATE" } } }

Daftar berikut mencakup semua parameter untuk permintaan:

  • schemaVersion(Opsional) - Versi skema untuk permintaan model penyematan multimodal

    • Jenis: string

    • Nilai yang diizinkan: "nova-multimodal-embed-v1"

    • Default: "nova-multimodal-embed-v1"

  • taskType(Wajib) - Menentukan jenis operasi embedding untuk melakukan pada konten input. single_embeddingmengacu pada menghasilkan satu penyematan per input model. segmented_embeddingmengacu pada segmentasi pertama input model per spesifikasi pengguna dan kemudian menghasilkan satu embedding per segmen.

    • Jenis: string

    • Nilai yang diizinkan: Harus “SINGLE_EMBEDDING” untuk panggilan sinkron.

  • singleEmbeddingParams (Wajib)

    • embeddingPurpose(Wajib) - Nova Multimodal Embeddings memungkinkan Anda untuk mengoptimalkan embeddings Anda tergantung pada aplikasi yang dimaksud. Contohnya termasuk MM-RAG, Manajemen Aset Digital untuk pencarian gambar dan video, perbandingan kesamaan untuk konten multimodal, atau klasifikasi dokumen untuk Pemrosesan Dokumen Cerdas. embeddingPurposememungkinkan Anda untuk menentukan kasus penggunaan embedding. Pilih nilai yang benar tergantung pada kasus penggunaan di bawah ini.

      • Penelusuran dan Pengambilan: Menyematkan kasus penggunaan seperti RAG dan pencarian melibatkan dua langkah utama: pertama, membuat indeks dengan membuat penyematan untuk konten, dan kedua, mengambil konten yang paling relevan dari indeks selama pencarian. Gunakan nilai-nilai berikut saat bekerja dengan kasus penggunaan pencarian dan pengambilan:

        • Pengindeksan:

          • “GENERIC_INDEX” - Membuat embeddings dioptimalkan untuk digunakan sebagai indeks dalam penyimpanan data vektor. Nilai ini harus digunakan terlepas dari modalitas yang Anda indeks.

        • Pencarian/pengambilan: Optimalkan penyematan Anda tergantung pada jenis konten yang Anda ambil:

          • “TEXT_RETRIEVAL” - Membuat embeddings dioptimalkan untuk mencari repositori yang hanya berisi embeddings teks.

          • “IMAGE_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan gambar yang dibuat dengan DetailLevel “STANDARD_IMAGE”.

          • “VIDEO_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan video atau penyematan yang dibuat dengan mode penyematan “AUDIO_VIDEO_COMBINED”.

          • “DOCUMENT_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan gambar dokumen yang dibuat dengan DetailLevel “DOCUMENT_IMAGE”.

          • “AUDIO_RETRIEVAL” - Membuat embeddings dioptimalkan untuk mencari repositori yang hanya berisi embeddings audio.

          • “GENERIC_RETRIEVAL” - Membuat embeddings yang dioptimalkan untuk mencari repositori yang berisi embeddings modalitas campuran.

        • Contoh: Di aplikasi penelusuran gambar tempat pengguna mengambil gambar menggunakan kueri teks, gunakan embeddingPurpose = generic_index saat membuat indeks penyematan berdasarkan gambar dan gunakan embeddingPurpose = image_retrieval saat membuat penyematan kueri yang digunakan untuk mengambil gambar.

      • “KLASIFIKASI” - Membuat embeddings yang dioptimalkan untuk melakukan klasifikasi.

      • “CLUSTERING” - Membuat embeddings yang dioptimalkan untuk pengelompokan.

    • embeddingDimension(Opsional) - Ukuran vektor untuk menghasilkan.

      • Jenis: int

      • Nilai yang diizinkan: 256 | 384 | 1024 | 3072

      • Standar: 3072

    • text(Opsional) - Merupakan konten teks. Tepat salah satu teks, gambar, video, audio harus ada.

      • truncationMode(Wajib) - Menentukan bagian teks mana yang akan terpotong dalam kasus di mana versi teks yang diberi token melebihi maksimum yang didukung oleh model.

        • Jenis: string

        • Nilai yang diizinkan:

          • “MULAI” - Hilangkan karakter dari awal teks bila perlu.

          • “END” - Hilangkan karakter dari akhir teks bila perlu.

          • “NONE” - Gagal jika panjang teks melebihi batas token maksimum model.

      • value(Opsional; Nilai atau sumber harus disediakan) - Nilai teks untuk membuat penyematan.

        • Jenis: string

        • Panjang maks: 8192 karakter

      • source(Opsional; Nilai atau sumber harus disediakan) - Referensi ke file teks yang disimpan di S3. Perhatikan bahwa opsi byte tidak berlaku untuk input teks. SourceObject Untuk meneruskan teks sebaris sebagai bagian dari permintaan, gunakan parameter nilai sebagai gantinya.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

    • image(Opsional) - Merupakan konten gambar. Tepat salah satu teks, gambar, video, audio harus ada.

      • detailLevel(Opsional) - Mendikte resolusi di mana gambar akan diproses dengan “STANDARD_IMAGE” menggunakan resolusi gambar yang lebih rendah dan “DOCUMENT_IMAGE” menggunakan gambar resolusi yang lebih tinggi untuk menafsirkan teks dengan lebih baik.

        • Jenis: string

        • Nilai yang diizinkan: “STANDARD_IMAGE” | “DOCUMENT_IMAGE”

        • Default: “STANDARD_IMAGE”

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “png” | “jpeg” | “gif” | “webp”

      • source(Wajib) - Sumber konten gambar.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

    • audio(Opsional) - Merupakan konten audio. Tepat salah satu teks, gambar, video, audio harus ada.

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “mp3" | “wav” | “ogg”

      • source(Wajib) - Sumber konten audio.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

        • Durasi audio maksimum: 30 detik

    • video(Opsional) - Merupakan konten video. Tepat salah satu teks, gambar, video, audio harus ada.

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “mp4" | “mov” | “mkv” | “webm” | “flv” | “mpeg” | “mpg” | “wmv” | “3gp”

      • source(Wajib) - Sumber konten video.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

        • Durasi video maksimum: 30 detik

      • embeddingMode (Wajib)

        • Jenis: string

        • Nilai: “AUDIO_VIDEO_COMBINED” | “AUDIO_VIDEO_SEPARATE”

          • “AUDIO_VIDEO_COMBINED” - Akan menghasilkan satu embedding yang menggabungkan konten yang dapat didengar dan visual.

          • “AUDIO_VIDEO_SEPARATE” - Akan menghasilkan dua embeddings, satu untuk konten yang dapat didengar dan satu untuk konten visual.

InvokeModel Respon Tubuh

Ketika InvokeModelmengembalikan hasil yang sukses, tubuh respon akan memiliki struktur berikut:

{ "embeddings": [ { "embeddingType": "TEXT" | "IMAGE" | "VIDEO" | "AUDIO" | "AUDIO_VIDEO_COMBINED", "embedding": number[], "truncatedCharLength": int // Only included if text input was truncated } ] }

Daftar berikut mencakup semua parameter untuk respons:

  • embeddings(Wajib) - Untuk sebagian besar permintaan, array ini akan berisi satu embedding. Untuk permintaan video di mana mode EmbeddingMode “AUDIO_VIDEO_SEPARATE” dipilih, array ini akan berisi dua penyematan - satu penyematan untuk konten video dan satu untuk konten audio.

    • Jenis: array embeddings dengan properti berikut

      • embeddingType(Wajib) - Melaporkan jenis penyematan yang dibuat.

        • Jenis: string

        • Nilai yang diizinkan: “TEKS” | “GAMBAR” | “VIDEO” | “AUDIO” | “AUDIO_VIDEO_COMBINED”

      • embedding(Wajib) - Vektor embedding.

        • Jenis: nomor []

      • truncatedCharLength(Opsional) - Hanya berlaku untuk permintaan penyematan teks. Dikembalikan jika versi tokenized dari teks masukan melebihi batasan model. Nilai menunjukkan karakter setelah teks dipotong sebelum menghasilkan embedding.

        • Jenis: int

Skema asinkron lengkap

Anda dapat membuat penyematan secara asinkron menggunakan fungsi Amazon Bedrock Runtime API,, dan. StartAsyncInvokeGetAsyncInvokeListAsyncInvokes API asinkron harus digunakan jika Anda ingin menggunakan Nova Embeddings untuk menyegmentasikan konten panjang seperti teks atau video dan audio yang panjang lebih dari 30 detik.

Saat menelepon StartAsyncInvoke, Anda harus memberikanmodelId,outputDataConfig, dan modelInput parameter.

response = bedrock_runtime.start_async_invoke( modelId="amazon.nova-2-multimodal-embeddings-v1:0", outputDataConfig=Data Config, modelInput=Model Input )

outputDataConfigmenentukan bucket S3 tempat Anda ingin menyimpan output yang dihasilkan. Ini memiliki struktur sebagai berikut:

{ "s3OutputDataConfig": { "s3Uri": "s3://your-s3-bucket" } }

s3UriIni adalah URI S3 dari bucket tujuan. Untuk parameter opsional tambahan, lihat StartAsyncInvoke dokumentasi.

Struktur berikut digunakan untuk modelInput parameter.

{ "schemaVersion": "nova-multimodal-embed-v1", "taskType": "SEGMENTED_EMBEDDING", "segmentedEmbeddingParams": { "embeddingPurpose": "GENERIC_INDEX" | "GENERIC_RETRIEVAL" | "TEXT_RETRIEVAL" | "IMAGE_RETRIEVAL" | "VIDEO_RETRIEVAL" | "DOCUMENT_RETRIEVAL" | "AUDIO_RETRIEVAL" | "CLASSIFICATION" | "CLUSTERING", "embeddingDimension": 256 | 384 | 1024 | 3072, "text": { "truncationMode": "START" | "END" | "NONE", "value": string, "source": { "s3Location": { "uri": "s3://Your S3 Object" } }, "segmentationConfig": { "maxLengthChars": int } }, "image": { "format": "png" | "jpeg" | "gif" | "webp", "source": SourceObject, "detailLevel": "STANDARD_IMAGE" | "DOCUMENT_IMAGE" }, "audio": { "format": "mp3" | "wav" | "ogg", "source": SourceObject, "segmentationConfig": { "durationSeconds": int } }, "video": { "format": "mp4" | "mov" | "mkv" | "webm" | "flv" | "mpeg" | "mpg" | "wmv" | "3gp", "source": SourceObject, "embeddingMode": "AUDIO_VIDEO_COMBINED" | "AUDIO_VIDEO_SEPARATE", "segmentationConfig": { "durationSeconds": int } } } }

Daftar berikut mencakup semua parameter untuk permintaan:

  • schemaVersion(Opsional) - Versi skema untuk permintaan model penyematan multimodal

    • Jenis: string

    • Nilai yang diizinkan: "nova-multimodal-embed-v1"

    • Default: "nova-multimodal-embed-v1"

  • taskType(Wajib) - Menentukan jenis operasi embedding untuk melakukan pada konten input. single_embeddingmengacu pada menghasilkan satu penyematan per input model. segmented_embeddingmengacu pada segmentasi pertama input model per spesifikasi pengguna dan kemudian menghasilkan satu embedding per segmen.

    • Jenis: string

    • Nilai yang diizinkan: Harus “SEGMENTED_EMBEDDING” untuk panggilan asinkron.

  • segmentedEmbeddingParams (Wajib)

    • embeddingPurpose(Wajib) - Nova Multimodal Embeddings memungkinkan Anda untuk mengoptimalkan embeddings Anda tergantung pada aplikasi yang dimaksud. Contohnya termasuk MM-RAG, Manajemen Aset Digital untuk pencarian gambar dan video, perbandingan kesamaan untuk konten multimodal, atau klasifikasi dokumen untuk Pemrosesan Dokumen Cerdas. embeddingPurposememungkinkan Anda untuk menentukan kasus penggunaan embedding. Pilih nilai yang benar tergantung pada kasus penggunaan di bawah ini.

      • Penelusuran dan Pengambilan: Menyematkan kasus penggunaan seperti RAG dan pencarian melibatkan dua langkah utama: pertama, membuat indeks dengan membuat penyematan untuk konten, dan kedua, mengambil konten yang paling relevan dari indeks selama pencarian. Gunakan nilai-nilai berikut saat bekerja dengan kasus penggunaan pencarian dan pengambilan:

        • Pengindeksan:

          • “GENERIC_INDEX” - Membuat embeddings dioptimalkan untuk digunakan sebagai indeks dalam penyimpanan data vektor. Nilai ini harus digunakan terlepas dari modalitas yang Anda indeks.

        • Pencarian/pengambilan: Optimalkan penyematan Anda tergantung pada jenis konten yang Anda ambil:

          • “TEXT_RETRIEVAL” - Membuat embeddings dioptimalkan untuk mencari repositori yang hanya berisi embeddings teks.

          • “IMAGE_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan gambar yang dibuat dengan DetailLevel “STANDARD_IMAGE”.

          • “VIDEO_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan video atau penyematan yang dibuat dengan mode penyematan “AUDIO_VIDEO_COMBINED”.

          • “DOCUMENT_RETRIEVAL” - Membuat penyematan yang dioptimalkan untuk mencari repositori yang hanya berisi penyematan gambar dokumen yang dibuat dengan DetailLevel “DOCUMENT_IMAGE”.

          • “AUDIO_RETRIEVAL” - Membuat embeddings dioptimalkan untuk mencari repositori yang hanya berisi embeddings audio.

          • “GENERIC_RETRIEVAL” - Membuat embeddings yang dioptimalkan untuk mencari repositori yang berisi embeddings modalitas campuran.

        • Contoh: Di aplikasi penelusuran gambar tempat pengguna mengambil gambar menggunakan kueri teks, gunakan embeddingPurpose = generic_index saat membuat indeks penyematan berdasarkan gambar dan gunakan embeddingPurpose = image_retrieval saat membuat penyematan kueri yang digunakan untuk mengambil gambar.

      • “KLASIFIKASI” - Membuat embeddings yang dioptimalkan untuk melakukan klasifikasi.

      • “CLUSTERING” - Membuat embeddings yang dioptimalkan untuk pengelompokan.

    • embeddingDimension(Opsional) - Ukuran vektor untuk menghasilkan.

      • Jenis: int

      • Nilai yang diizinkan: 256 | 384 | 1024 | 3072

      • Standar: 3072

    • text(Opsional) - Merupakan konten teks. Tepat salah satu teks, gambar, video, audio harus ada.

      • truncationMode(Wajib) - Menentukan bagian teks mana yang akan terpotong dalam kasus di mana versi teks yang diberi token melebihi maksimum yang didukung oleh model.

        • Jenis: string

        • Nilai yang diizinkan:

          • “MULAI” - Hilangkan karakter dari awal teks bila perlu.

          • “END” - Hilangkan karakter dari akhir teks bila perlu.

          • “NONE” - Gagal jika panjang teks melebihi batas token maksimum model.

      • value(Opsional; Nilai atau sumber harus disediakan) - Nilai teks untuk membuat penyematan.

        • Jenis: string

        • Panjang maks: 8192 karakter

      • source(Opsional; Nilai atau sumber harus disediakan) - Referensi ke file teks yang disimpan di S3. Perhatikan bahwa opsi byte tidak berlaku untuk input teks. SourceObject Untuk meneruskan teks sebaris sebagai bagian dari permintaan, gunakan parameter nilai sebagai gantinya.

      • segmentationConfig(Wajib) - Mengontrol bagaimana konten teks harus disegmentasi menjadi beberapa embeddings.

        • maxLengthChars(Opsional) - Panjang maksimum untuk memungkinkan setiap segmen. Model akan mencoba untuk segmen hanya pada batas kata.

          • Jenis: int

          • Kisaran yang valid: 800-50.000

          • Default: 32.000

    • image(Opsional) - Merupakan konten gambar. Tepat salah satu teks, gambar, video, audio harus ada.

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “png” | “jpeg” | “gif” | “webp”

      • source(Wajib) - Sumber konten gambar.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

      • detailLevel(Opsional) - Mendikte resolusi di mana gambar akan diproses dengan “STANDARD_IMAGE” menggunakan resolusi gambar yang lebih rendah dan “DOCUMENT_IMAGE” menggunakan gambar resolusi yang lebih tinggi untuk menafsirkan teks dengan lebih baik.

        • Jenis: string

        • Nilai yang diizinkan: “STANDARD_IMAGE” | “DOCUMENT_IMAGE”

        • Default: “STANDARD_IMAGE”

    • audio(Opsional) - Merupakan konten audio. Tepat salah satu teks, gambar, video, audio harus ada.

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “mp3" | “wav” | “ogg”

      • source(Wajib) - Sumber konten audio.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

      • segmentationConfig(Wajib) - Mengontrol bagaimana konten audio harus disegmentasi menjadi beberapa embeddings.

        • durationSeconds(Opsional) - Durasi maksimum audio (dalam detik) untuk digunakan untuk setiap segmen.

          • Jenis: int

          • Rentang yang valid: 1-30

          • Default: 5

    • video(Opsional) - Merupakan konten video. Tepat salah satu teks, gambar, video, audio harus ada.

      • format (Wajib)

        • Jenis: string

        • Nilai yang diizinkan: “mp4" | “mov” | “mkv” | “webm” | “flv” | “mpeg” | “mpg” | “wmv” | “3gp”

      • source(Wajib) - Sumber konten video.

        • Jenis: SourceObject (lihat bagian “Objek Umum”)

      • embeddingMode (Wajib)

        • Jenis: string

        • Nilai: “AUDIO_VIDEO_COMBINED” | “AUDIO_VIDEO_SEPARATE”

          • “AUDIO_VIDEO_COMBINED” - Akan menghasilkan satu embedding untuk setiap segmen yang menggabungkan konten yang dapat didengar dan visual.

          • “AUDIO_VIDEO_SEPARATE” - Akan menghasilkan dua embeddings untuk setiap segmen, satu untuk konten audio dan satu untuk konten video.

      • segmentationConfig(Wajib) - Mengontrol bagaimana konten video harus disegmentasi menjadi beberapa embeddings.

        • durationSeconds(Opsional) - Durasi maksimum video (dalam detik) untuk digunakan untuk setiap segmen.

          • Jenis: int

          • Rentang yang valid: 1-30

          • Default: 5

StartAsyncInvoke Respon

Tanggapan dari panggilan ke StartAsyncInvokeakan memiliki struktur di bawah ini. invocationArnDapat digunakan untuk menanyakan status pekerjaan asinkron menggunakan fungsi. GetAsyncInvoke

{ "invocationArn": "arn:aws:bedrock:us-east-1:xxxxxxxxxxxx:async-invoke/lvmxrnjf5mo3", }

Output Asinkron

Saat pembuatan embeddings asinkron selesai, artefak keluaran ditulis ke bucket S3 yang Anda tentukan sebagai tujuan keluaran. File-file tersebut akan memiliki struktur sebagai berikut:

amzn-s3-demo-bucket/ job-id/ segmented-embedding-result.json embedding-audio.jsonl embedding-image.json embedding-text.jsonl embedding-video.jsonl manifest.json

segmented-embedding-result.jsonWill berisi hasil pekerjaan keseluruhan dan referensi ke file jsonl yang sesuai yang berisi penyematan aktual per modalitas. Di bawah ini adalah contoh file yang terpotong:

{ "sourceFileUri": string, "embeddingDimension": 256 | 384 | 1024 | 3072, "embeddingResults": [ { "embeddingType": "TEXT" | "IMAGE" | "VIDEO" | "AUDIO" | "AUDIO_VIDEO_COMBINED", "status": "SUCCESS" | "FAILURE" | "PARTIAL_SUCCESS", "failureReason": string, // Granular error codes "message": string, // Human-readbale failure message "outputFileUri": string // S3 URI to a "embedding-modality.jsonl" file } ... ] }

embedding-modality.jsonAkan menjadi file jsonl yang berisi output embedding untuk setiap modalitas. Setiap baris dalam file jsonl akan mematuhi skema berikut:

{ "embedding": number[], // The generated embedding vector "segmentMetadata": { "segmentIndex": number, "segmentStartCharPosition": number, // Included for text only "segmentEndCharPosition": number, // Included for text only "truncatedCharLength": number, // Included only when text gets truncated "segmentStartSeconds": number, // Included for audio/video only "segmentEndSeconds": number // Included for audio/video only }, "status": "SUCCESS" | "FAILURE", "failureReason": string, // Granular error codes "message": string // Human-readable failure message }

Daftar berikut mencakup semua parameter untuk respons. Untuk karakter teks atau audio/video waktu, semua waktu mulai dan berakhir berbasis nol. Selain itu, semua posisi teks akhir atau nilai audio/video waktu bersifat inklusif.

  • embedding(Wajib) — Vektor embedding.

    • Jenis: angka

  • segmentMetadata— Metadata untuk segmen.

    • segmentIndex— Indeks segmen dalam array yang disediakan dalam permintaan.

    • segmentStartCharPosition— Hanya untuk teks. Posisi karakter awal (inklusif) dari konten yang disematkan dalam segmen.

    • segmentEndCharPosition— Hanya untuk teks. Posisi karakter akhir (eksklusif) dari konten yang disematkan dalam segmen.

    • truncatedCharLength(Opsional) — Dikembalikan jika versi teks masukan yang diberi token melebihi batasan model. Nilai menunjukkan karakter setelah teks dipotong sebelum menghasilkan embedding.

      • Jenis: integer

    • segmentStartSeconds- audio/video Hanya untuk. Posisi waktu mulai dari konten yang disematkan dalam segmen.

    • segmentEndSeconds- audio/video Hanya untuk. Posisi waktu akhir dari konten yang disematkan dalam segmen.

  • status— Status untuk segmen.

  • failureReason— Alasan rinci tentang kegagalan segmen.

    • RAI_VIOLATION_INPUT_TEXT_DEFLECTION— Teks input melanggar kebijakan RAI.

    • RAI_VIOLATION_INPUT_IMAGE_DEFLECTION— gambar input melanggar kebijakan RAI.

    • INVALID_CONTENT— Masukan tidak valid.

    • RATE_LIMIT_EXCEEDED— Permintaan penyematan dibatasi karena tidak tersedianya layanan.

    • INTERNAL_SERVER_EXCEPTION- Ada yang tidak beres.

  • message— Pesan kegagalan terkait.

Batasan file untuk Nova Embeddings

Operasi sinkron dapat menerima input S3 dan potongan sebaris. Operasi asinkron hanya dapat menerima input S3.

Saat membuat embeddings secara asinkron, Anda harus memastikan bahwa file Anda dipisahkan menjadi sejumlah segmen yang sesuai. Untuk penyematan teks Anda tidak dapat memiliki lebih dari 1900 segmen. Untuk penyematan audio dan video, Anda tidak dapat memiliki lebih dari 1434 segmen.

Batas ukuran Input sinkron

Jenis File

Batas Ukuran

(Inline) Semua jenis file

25 MB

(S3) Teks

1 MB; 50.000 karakter

(S3) Gambar

50 MB

(S3) Video

30 detik; 100 MB

(S3) Audio

30 detik; 100 MB

catatan

Pembatasan file sebaris 25 MB adalah setelah penyematan Base64. Hal ini menyebabkan inflasi ukuran file sekitar 33%

Batas ukuran Input Asinkron

Jenis File

Batas Ukuran

(S3) Teks

634 MB

(S3) Gambar

50 MB

(S3) Video

2 GB; 2 jam

(S3) Audio

1 GB; 2 jam

Jenis file masukan

Modalitas

Jenis berkas

Format Gambar

PNG, JPEG, WEBP, GIF

Format Audio

MP3, WAV, OGG

Format Video

MP4, MOV, MKV, WEBM, FLV, MPEG, MPG, WMV, 3GP