Menguji dan menanyakan basis pengetahuan multimodal - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menguji dan menanyakan basis pengetahuan multimodal

Setelah menelan konten multimodal, Anda dapat menguji dan menanyakan basis pengetahuan Anda menggunakan konsol atau API. Jenis kueri yang tersedia bergantung pada pendekatan pemrosesan yang Anda pilih.

Console
Untuk menguji basis pengetahuan Anda dari konsol
  1. Dari halaman detail basis pengetahuan Anda, gulir ke bagian Test knowledge base.

  2. Pilih jenis kueri Anda:

    • Pengambilan standar saja: Kueri dan ambil informasi dari sumber data dalam satu Basis Pengetahuan.

    • Pengambilan dan generasi respons: Kueri Basis Pengetahuan tunggal dan hasilkan respons berdasarkan hasil yang diambil dengan menggunakan model dasar.

      catatan

      Jika Anda memiliki konten multimodal, Anda harus menggunakan parser BDA untuk pengambilan dan pembuatan respons.

  3. Konfigurasikan opsi tambahan sesuai kebutuhan:

    • Potongan sumber: Tentukan jumlah maksimum potongan sumber yang akan dikembalikan

    • Jenis Pencarian: Pilih jenis pencarian untuk menyesuaikan strategi kueri

    • Filter metadata: Terapkan filter untuk mempersempit hasil pencarian

    • Pagar pembatas: Pilih pagar pembatas yang ada atau buat yang baru

  4. Masukkan kueri teks atau unggah gambar (hanya Nova Multimodal Embeddings) untuk mencari konten multimodal Anda. Gunakan tombol lampiran untuk mengunggah gambar untuk pencarian kesamaan visual.

  5. Tinjau hasilnya, yang meliputi:

    • Potongan konten yang diambil dengan skor relevansi

    • Referensi file sumber dan stempel waktu (untuk audio/video)

    • Metadata termasuk jenis file dan informasi pemrosesan

    • Untuk konten multimedia, kontrol pemutaran dengan pemosisian segmen otomatis berdasarkan stempel waktu yang diambil

API

Contoh berikut menunjukkan cara menggunakan Amazon Bedrock Agent Runtime API untuk menanyakan basis pengetahuan multimodal Anda secara terprogram:

Contoh kueri teks

Cari menggunakan input teks:

aws bedrock-agent-runtime retrieve \ --knowledge-base-id <knowledge-base-id> \ --retrieval-query text="robot automation in manufacturing"
Contoh kueri gambar (hanya Penyematan Nova Multimodal)

Cari menggunakan gambar yang diunggah:

{ "knowledgeBaseId": "<knowledge-base-id>", "retrievalQuery": { "imageQuery": { "inlineContent": { "mimeType": "image/jpeg", "data": "<base64-encoded-image>" } } } }

Jenis kueri yang didukung

Kueri teks

Didukung dengan pendekatan Nova Multimodal Embeddings dan BDA. Cari menggunakan teks bahasa alami untuk menemukan konten yang relevan di semua jenis media.

Kueri gambar

Hanya didukung dengan Nova Multimodal Embeddings. Unggah gambar untuk menemukan konten yang mirip secara visual di basis pengetahuan Anda.

Memahami metadata respons

Respons kueri multimodal mencakup metadata tambahan untuk konten multimedia:

Atribusi sumber

Lokasi file asli (SourceURI) dan lokasi penyimpanan multimodal (supplementalURI) untuk akses yang andal

Metadata temporal

Mulai dan akhiri stempel waktu untuk segmen audio dan video, memungkinkan navigasi yang tepat ke konten yang relevan

Informasi jenis konten

Format file, metode pemrosesan, dan indikator modalitas untuk membantu aplikasi menangani berbagai jenis konten dengan tepat

Struktur metadata basis data vektor

Ketika konten multimodal diproses dan disimpan, struktur metadata berikut digunakan dalam database vektor:

  • bidang teks: Untuk file multimedia yang diproses dengan Nova Multimodal Embeddings, bidang ini berisi string kosong karena konten disematkan sebagai multimedia asli daripada teks

  • bidang metadata: Berisi informasi terstruktur termasuk detail sumber dan referensi konten terkait:

    { "source": { "sourceType": "S3", "s3Location": { "uri": "s3://source-bucket/path/to/file.mp4" } }, "relatedContent": [{ "type": "S3", "s3Location": { "uri": "s3://multimodal-storage-bucket/processed/file.mp4" } }] }
  • Bidang yang dibuat secara otomatis: Bidang tambahan untuk pemfilteran dan identifikasi:

    • x-amz-bedrock-kb-source-uri: URI sumber asli untuk operasi penyaringan

    • x-amz-bedrock-kb-data-source-id: Pengidentifikasi sumber data untuk melacak asal konten

    • x-amz-bedrock-kb-chunk-start-time-in-millis: Mulai stempel waktu dalam milidetik untuk segmen audio dan video

    • x-amz-bedrock-kb-chunk-end-time-in-millis: Akhiri stempel waktu dalam milidetik untuk segmen audio dan video

    • x-amz-bedrock-kb-source-file-mime-type: Jenis MIME dari file sumber

    • x-amz-bedrock-kb-source-file-modality: Modalitas file sumber (TEKS, GAMBAR, AUDIO, VIDEO)

penting

Aplikasi harus menggunakan stempel waktu yang disediakan untuk mengekstrak dan memutar segmen tertentu dari file audio dan video. Basis pengetahuan mengembalikan referensi ke file lengkap, bukan klip yang telah tersegmentasi sebelumnya.