Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kueri basis pengetahuan dan ambil data
penting
Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.
Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan mengambil potongan dari data sumber yang relevan dengan kueri menggunakan operasi API. Retrieve Anda juga dapat menggunakan model reranking alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.
Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:
- Console
-
Untuk menguji basis pengetahuan Anda
-
Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock
. -
Di panel navigasi kiri, pilih Basis pengetahuan.
-
Di bagian Basis pengetahuan, lakukan salah satu tindakan berikut:
-
Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih Uji basis pengetahuan. Jendela uji mengembang dari kanan.
-
Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.
-
-
Di jendela pengujian, hapus Hasilkan respons untuk kueri Anda untuk mengembalikan informasi yang diambil langsung dari basis pengetahuan Anda.
-
(Opsional) Pilih ikon konfigurasi (
) untuk membuka Konfigurasi. Untuk informasi tentang konfigurasi, lihatKonfigurasikan dan sesuaikan kueri dan pembuatan respons. -
Masukkan kueri di kotak teks di jendela obrolan dan pilih Jalankan untuk mengembalikan respons dari basis pengetahuan.
-
Potongan sumber dikembalikan secara langsung sesuai urutan relevansi. Gambar yang diekstrak dari sumber data Anda juga dapat dikembalikan sebagai potongan sumber.
-
Untuk melihat detail tentang potongan yang dikembalikan, pilih Tampilkan detail sumber.
-
Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas konfigurasi Kueri.
-
Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan (
) di sebelahnya. Anda dapat melihat informasi berikut:-
Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin (
). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal (
) untuk menavigasi ke objek S3 yang berisi file. -
Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam
.metadata.jsonfile yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian Metadata dan pemfilteran di. Konfigurasikan dan sesuaikan kueri dan pembuatan respons
-
-
Opsi obrolan
-
Beralih ke menghasilkan respons berdasarkan potongan sumber yang diambil dengan mengaktifkan Hasilkan respons. Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.
-
Untuk menghapus jendela obrolan, pilih ikon sapu (
). -
Untuk menyalin semua output di jendela obrolan, pilih ikon salin (
).
-
- API
-
Untuk menanyakan basis pengetahuan dan hanya mengembalikan teks yang relevan dari sumber data, kirim Retrievepermintaan dengan titik akhir waktu proses Agen untuk Amazon Bedrock.
Bidang berikut diperlukan:
Bidang Deskripsi dasar knowledgeBaseId Untuk menentukan basis pengetahuan untuk query. RetrievalQuery Berisi textbidang untuk menentukan kueri.GuardrailsConfiguration Sertakan bidang GuardrailsConfiguration seperti guardrailsIddanguardrailsVersionuntuk menggunakan pagar pembatas Anda dengan permintaanBidang berikut adalah opsional:
Bidang Kasus penggunaan nextToken Untuk mengembalikan kumpulan tanggapan berikutnya (lihat bidang respons di bawah). RetrievalConfiguration Untuk menyertakan konfigurasi kueri untuk menyesuaikan pencarian vektor. Untuk informasi selengkapnya, lihat KnowledgeBaseVectorSearchConfiguration. Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan
rerankingConfigurationbidang dalam. KnowledgeBaseVectorSearchConfigurationrerankingConfigurationBidang memetakan ke VectorSearchRerankingConfigurationobjek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat VectorSearchRerankingConfiguration.catatan
Jika Anda
numberOfRerankedResultsnilai yang Anda tentukan lebih besar darinumberOfResultsnilai dalam KnowledgeBaseVectorSearchConfiguration, jumlah maksimum hasil yang akan dikembalikan adalah nilai untuknumberOfResults. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian modifikasi kueri diKonfigurasikan dan sesuaikan kueri dan pembuatan respons. Jika Anda menggunakan dekomposisi kueri,numberOfRerankedResultsbisa sampai lima kali.numberOfResultsRespons mengembalikan potongan sumber dari sumber data sebagai array KnowledgeBaseRetrievalResultobjek di lapangan.
retrievalResultsMasing-masing KnowledgeBaseRetrievalResultberisi bidang-bidang berikut:Bidang Deskripsi content Berisi potongan sumber teks di textatau potongan sumber gambar di bidang.byteContentJika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:.data:image/jpeg;base64,${base64-encoded string}Metadata Berisi setiap atribut metadata sebagai kunci dan nilai metadata sebagai nilai JSON yang dipetakan kunci. lokasi Berisi URI atau URL dokumen yang dimiliki potongan sumber. skor Skor relevansi dokumen. Anda dapat menggunakan skor ini untuk menganalisis peringkat hasil. Jika jumlah potongan sumber melebihi apa yang bisa muat dalam respons, nilai dikembalikan di
nextTokenbidang. Gunakan nilai itu dalam permintaan lain untuk mengembalikan kumpulan hasil berikutnya.Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:
-
x-amz-bedrock-kb-byte-content-source— Berisi URI Amazon S3 dari gambar. -
x-amz-bedrock-kb-description— Berisi string yang dikodekan base64 untuk gambar.
catatan
Anda tidak dapat memfilter header respons metadata ini saat mengonfigurasi filter metadata.
Kueri multimodal
Untuk basis pengetahuan yang menggunakan model penyematan multimodal, Anda dapat melakukan kueri dengan gambar selain teks.
retrievalQueryBidang ini mendukungmultimodalInputListbidang untuk kueri gambar:catatan
Untuk panduan komprehensif tentang pengaturan dan bekerja dengan basis pengetahuan multimodal, termasuk memilih antara pendekatan Nova dan BDA, lihat. Membangun basis pengetahuan untuk konten multimodal
{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Anda juga dapat melakukan kueri dengan gambar hanya dengan menghilangkan
textbidang:{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }Pola kueri multimodal umum
- Image-to-image pencarian
-
Unggah gambar untuk menemukan gambar yang mirip secara visual. Contoh: Unggah foto sepatu Nike merah untuk menemukan sepatu serupa di katalog produk Anda.
- Teks+penyempurnaan gambar
-
Gabungkan teks dan gambar untuk hasil yang lebih tepat. Contoh: “Temukan sepatu serupa tetapi dengan warna berbeda” bersama dengan gambar sepatu yang diunggah.
- Pencarian dokumen visual
-
Cari bagan, diagram, atau elemen visual dalam dokumen. Contoh: Unggah gambar bagan untuk menemukan bagan serupa di koleksi dokumen Anda.
Memilih antara Nova dan BDA untuk konten multimodal
Saat bekerja dengan konten multimodal, pilih pendekatan Anda berdasarkan jenis konten dan pola kueri Anda:
Matriks Keputusan Nova vs BDA Jenis Konten Gunakan Embeddings Nova Multimodal Gunakan Parser Otomasi Data Batuan Dasar (BDA) Konten Video Fokus mendongeng visual (olahraga, iklan, demonstrasi), pertanyaan tentang elemen visual, konten ucapan minimal Penting speech/narration (presentasi, rapat, tutorial), pertanyaan tentang konten lisan, perlu transkrip Konten Audio Identifikasi musik atau efek suara, analisis audio non-ucapan Podcast, wawancara, rapat, konten apa pun dengan pidato yang membutuhkan transkripsi Konten Gambar Pencarian kesamaan visual, image-to-image pengambilan, analisis konten visual Ekstraksi teks dari gambar, pemrosesan dokumen, persyaratan OCR catatan
Penyematan multimodal Nova tidak dapat memproses konten ucapan secara langsung. Jika file audio atau video Anda berisi informasi lisan yang penting, gunakan parser BDA untuk mengonversi ucapan menjadi teks terlebih dahulu, atau pilih model penyematan teks sebagai gantinya.
Keterbatasan kueri multimodal
-
Maksimum satu gambar per kueri dalam rilis saat ini
-
Kueri gambar hanya didukung dengan model penyematan multimodal (Titan G1 atau Cohere Embed v3)
-
RetrieveAndGenerate API tidak didukung untuk basis pengetahuan dengan model penyematan multimodal dan bucket konten S3
-
Jika Anda memberikan kueri gambar ke basis pengetahuan menggunakan model penyematan khusus teks, kesalahan 4xx akan dikembalikan
Struktur respons API multimodal
Respons pengambilan untuk konten multimodal mencakup metadata tambahan:
-
URI Sumber: Menunjuk ke lokasi bucket S3 asli Anda
-
URI Tambahan: Menunjuk ke salinan di bucket penyimpanan multimodal Anda
-
Metadata stempel waktu: Termasuk untuk potongan video dan audio untuk memungkinkan pemosisian pemutaran yang tepat
catatan
Saat menggunakan API atau SDK, Anda harus menangani pengambilan file dan navigasi stempel waktu di aplikasi Anda. Konsol menangani ini secara otomatis dengan pemutaran video yang disempurnakan dan navigasi stempel waktu otomatis.
-
catatan
Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut:
-
Kurangi jumlah maksimum hasil yang diambil (ini mempersingkat apa yang diisi untuk placeholder $search_results$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan
-
Buat ulang sumber data dengan strategi chunking yang menggunakan potongan yang lebih kecil (ini mempersingkat apa yang diisi untuk placeholder $search_results$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan
-
Persingkat template prompt.
-
Persingkat kueri pengguna (ini mempersingkat apa yang diisi untuk placeholder $query$ di). Templat prompt basis pengetahuan: orkestrasi & pembuatan