Kueri basis pengetahuan dan ambil data

penting

Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.

Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan mengambil potongan dari data sumber yang relevan dengan kueri menggunakan operasi API. Retrieve Anda juga dapat menggunakan model reranking alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.

Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

Console

Untuk menguji basis pengetahuan Anda

Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock.
Di panel navigasi kiri, pilih Basis pengetahuan.
Di bagian Basis pengetahuan, lakukan salah satu tindakan berikut:
- Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih Uji basis pengetahuan. Jendela uji mengembang dari kanan.
- Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.
Di jendela pengujian, hapus Hasilkan respons untuk kueri Anda untuk mengembalikan informasi yang diambil langsung dari basis pengetahuan Anda.
(Opsional) Pilih ikon konfigurasi ( ) untuk membuka Konfigurasi. Untuk informasi tentang konfigurasi, lihatKonfigurasikan dan sesuaikan kueri dan pembuatan respons.
Masukkan kueri di kotak teks di jendela obrolan dan pilih Jalankan untuk mengembalikan respons dari basis pengetahuan.
Potongan sumber dikembalikan secara langsung sesuai urutan relevansi. Gambar yang diekstrak dari sumber data Anda juga dapat dikembalikan sebagai potongan sumber.
Untuk melihat detail tentang potongan yang dikembalikan, pilih Tampilkan detail sumber.
- Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas konfigurasi Kueri.
- Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan ( ) di sebelahnya. Anda dapat melihat informasi berikut:
  - Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin ( ). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal ( ) untuk menavigasi ke objek S3 yang berisi file.
  - Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam .metadata.json file yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian Metadata dan pemfilteran di. Konfigurasikan dan sesuaikan kueri dan pembuatan respons

Opsi obrolan

Beralih ke menghasilkan respons berdasarkan potongan sumber yang diambil dengan mengaktifkan Hasilkan respons. Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.
Untuk menghapus jendela obrolan, pilih ikon sapu ( ).
Untuk menyalin semua output di jendela obrolan, pilih ikon salin ( ).

API

Untuk menanyakan basis pengetahuan dan hanya mengembalikan teks yang relevan dari sumber data, kirim Retrievepermintaan dengan titik akhir waktu proses Agen untuk Amazon Bedrock.

Bidang berikut diperlukan:

Bidang	Deskripsi dasar
knowledgeBaseId	Untuk menentukan basis pengetahuan untuk query.
RetrievalQuery	Berisi `text` bidang untuk menentukan kueri.
GuardrailsConfiguration	Sertakan bidang GuardrailsConfiguration seperti `guardrailsId` dan `guardrailsVersion` untuk menggunakan pagar pembatas Anda dengan permintaan

Bidang berikut adalah opsional:

Bidang	Kasus penggunaan
nextToken	Untuk mengembalikan kumpulan tanggapan berikutnya (lihat bidang respons di bawah).
RetrievalConfiguration	Untuk menyertakan konfigurasi kueri untuk menyesuaikan pencarian vektor. Untuk informasi selengkapnya, lihat KnowledgeBaseVectorSearchConfiguration.

Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan rerankingConfiguration bidang dalam. KnowledgeBaseVectorSearchConfiguration rerankingConfigurationBidang memetakan ke VectorSearchRerankingConfigurationobjek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat VectorSearchRerankingConfiguration.

catatan

Jika Anda numberOfRerankedResults nilai yang Anda tentukan lebih besar dari numberOfResults nilai dalam KnowledgeBaseVectorSearchConfiguration, jumlah maksimum hasil yang akan dikembalikan adalah nilai untuknumberOfResults. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian modifikasi kueri diKonfigurasikan dan sesuaikan kueri dan pembuatan respons. Jika Anda menggunakan dekomposisi kueri, numberOfRerankedResults bisa sampai lima kali. numberOfResults

Respons mengembalikan potongan sumber dari sumber data sebagai array KnowledgeBaseRetrievalResultobjek di lapangan. retrievalResults Masing-masing KnowledgeBaseRetrievalResultberisi bidang-bidang berikut:

Bidang	Deskripsi
content	Berisi potongan sumber teks di `text` atau potongan sumber gambar di bidang. `byteContent` Jika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:. `data:image/jpeg;base64,${base64-encoded string}`
Metadata	Berisi setiap atribut metadata sebagai kunci dan nilai metadata sebagai nilai JSON yang dipetakan kunci.
lokasi	Berisi URI atau URL dokumen yang dimiliki potongan sumber.
skor	Skor relevansi dokumen. Anda dapat menggunakan skor ini untuk menganalisis peringkat hasil.

Jika jumlah potongan sumber melebihi apa yang bisa muat dalam respons, nilai dikembalikan di nextToken bidang. Gunakan nilai itu dalam permintaan lain untuk mengembalikan kumpulan hasil berikutnya.

Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:

x-amz-bedrock-kb-byte-content-source— Berisi URI Amazon S3 dari gambar.
x-amz-bedrock-kb-description— Berisi string yang dikodekan base64 untuk gambar.

catatan

Anda tidak dapat memfilter header respons metadata ini saat mengonfigurasi filter metadata.

Kueri multimodal

Untuk basis pengetahuan yang menggunakan model penyematan multimodal, Anda dapat melakukan kueri dengan teks atau gambar. retrievalQueryBidang ini mendukung multimodalInputList bidang untuk kueri gambar:

catatan

Untuk panduan komprehensif tentang pengaturan dan bekerja dengan basis pengetahuan multimodal, termasuk memilih antara pendekatan Nova dan BDA, lihat. Membangun basis pengetahuan untuk konten multimodal

Anda dapat melakukan kueri dengan gambar dengan menggunakan multimodalInputList bidang:


{
    "knowledgeBaseId": "EXAMPLE123", 
    "retrievalQuery": {
        "multimodalInputList": [
            {
                "content": {
                    "byteContent": "base64-encoded-image-data"
                },
                "modality": "IMAGE"
            }
        ]
    }
}

Atau Anda dapat menanyakan dengan teks hanya dengan menggunakan text bidang:


{
    "knowledgeBaseId": "EXAMPLE123",
    "retrievalQuery": {
        "text": "Find similar shoes"
    }
}

Pola kueri multimodal umum

Berikut ini adalah beberapa pola query umum:

Image-to-image pencarian: Unggah gambar untuk menemukan gambar yang mirip secara visual. Contoh: Unggah foto sepatu Nike merah untuk menemukan sepatu serupa di katalog produk Anda.
Pencarian berbasis teks: Gunakan kueri teks untuk menemukan konten yang relevan. Contoh: “Temukan sepatu serupa” untuk mencari katalog produk Anda menggunakan deskripsi teks.
Pencarian dokumen visual: Cari bagan, diagram, atau elemen visual dalam dokumen. Contoh: Unggah gambar bagan untuk menemukan bagan serupa di koleksi dokumen Anda.

Memilih antara Nova dan BDA untuk konten multimodal

Saat bekerja dengan konten multimodal, pilih pendekatan Anda berdasarkan jenis konten dan pola kueri Anda:

Matriks Keputusan Nova vs BDA
Jenis Konten	Gunakan Embeddings Nova Multimodal	Gunakan Parser Otomasi Data Batuan Dasar (BDA)
Konten Video	Fokus mendongeng visual (olahraga, iklan, demonstrasi), pertanyaan tentang elemen visual, konten ucapan minimal	Penting speech/narration (presentasi, rapat, tutorial), pertanyaan tentang konten lisan, perlu transkrip
Konten Audio	Identifikasi musik atau efek suara, analisis audio non-ucapan	Podcast, wawancara, rapat, konten apa pun dengan pidato yang membutuhkan transkripsi
Konten Gambar	Pencarian kesamaan visual, image-to-image pengambilan, analisis konten visual	Ekstraksi teks dari gambar, pemrosesan dokumen, persyaratan OCR

catatan

Penyematan multimodal Nova tidak dapat memproses konten ucapan secara langsung. Jika file audio atau video Anda berisi informasi lisan yang penting, gunakan parser BDA untuk mengonversi ucapan menjadi teks terlebih dahulu, atau pilih model penyematan teks sebagai gantinya.

Keterbatasan kueri multimodal

Berikut ini adalah beberapa batasan dengan kueri multimodal:

Maksimum satu gambar per kueri dalam rilis saat ini
Kueri gambar hanya didukung dengan model penyematan multimodal (Titan G1 atau Cohere Embed v3)
RetrieveAndGenerate API tidak didukung untuk basis pengetahuan dengan model penyematan multimodal dan bucket konten S3
Jika Anda memberikan kueri gambar ke basis pengetahuan menggunakan model penyematan khusus teks, kesalahan 4xx akan dikembalikan

Struktur respons API multimodal

Respons pengambilan untuk konten multimodal mencakup metadata tambahan:

URI Sumber: Menunjuk ke lokasi bucket S3 asli Anda
URI Tambahan: Menunjuk ke salinan di bucket penyimpanan multimodal Anda
Metadata stempel waktu: Termasuk untuk potongan video dan audio untuk memungkinkan pemosisian pemutaran yang tepat

catatan

Saat menggunakan API atau SDK, Anda harus menangani pengambilan file dan navigasi stempel waktu di aplikasi Anda. Konsol menangani ini secara otomatis dengan pemutaran video yang disempurnakan dan navigasi stempel waktu otomatis.

catatan

Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut:

Kurangi jumlah maksimum hasil yang diambil (ini mempersingkat apa yang diisi untuk placeholder $search_results$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan
Buat ulang sumber data dengan strategi chunking yang menggunakan potongan yang lebih kecil (ini mempersingkat apa yang diisi untuk placeholder $search_results$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan
Persingkat template prompt.
Persingkat kueri pengguna (ini mempersingkat apa yang diisi untuk placeholder $query$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan

Kueri basis pengetahuan dan hasilkan tanggapan