Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kueri basis pengetahuan dan hasilkan tanggapan berdasarkan data yang diambil
Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.
Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan menghasilkan respons berdasarkan potongan yang diambil dari data sumber Anda dengan menggunakan operasi API. RetrieveAndGenerate Tanggapan dikembalikan dengan kutipan ke data sumber asli. Anda juga dapat menggunakan model reranking alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.
Batasan konten multimodal
RetrieveAndGeneratememiliki dukungan terbatas untuk konten multimodal. Saat menggunakan Nova Multimodal Embeddings, fungsionalitas RAG dibatasi hanya untuk konten teks. Untuk dukungan multimodal penuh termasuk pemrosesan audio dan video, gunakan BDA dengan model penyematan teks. Lihat perinciannya di Membangun basis pengetahuan untuk konten multimodal.
Gambar yang dikembalikan dari Retrieve respons selama RetrieveAndGenerate aliran disertakan dalam prompt untuk pembuatan respons. RetrieveAndGenerateRespons tidak dapat menyertakan gambar, tetapi dapat mengutip sumber yang berisi gambar.
Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:
- Console
-
Untuk menguji basis pengetahuan Anda
-
Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock.
-
Di panel navigasi kiri, pilih Basis pengetahuan.
-
Di bagian Basis pengetahuan, lakukan salah satu tindakan berikut:
-
Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih Uji basis pengetahuan. Jendela uji mengembang dari kanan.
-
Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.
-
Untuk menghasilkan tanggapan berdasarkan informasi yang diambil dari basis pengetahuan Anda, aktifkan Hasilkan tanggapan untuk kueri Anda. Amazon Bedrock akan menghasilkan tanggapan berdasarkan sumber data Anda dan mengutip informasi yang diberikannya dengan catatan kaki.
-
Untuk memilih model yang akan digunakan untuk menghasilkan respons, pilih Pilih model. Kemudian pilih Terapkan.
-
(Opsional) Pilih ikon konfigurasi (
) untuk membuka Konfigurasi. Untuk informasi tentang konfigurasi, lihatKonfigurasikan dan sesuaikan kueri dan pembuatan respons.
-
Masukkan kueri di kotak teks di jendela obrolan dan pilih Jalankan untuk mengembalikan respons dari basis pengetahuan.
-
Pilih catatan kaki untuk melihat kutipan dari sumber yang dikutip untuk bagian respons tersebut. Pilih tautan untuk menavigasi ke objek S3 yang berisi file.
-
Untuk melihat detail tentang potongan yang dikembalikan, pilih Tampilkan detail sumber.
-
Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas konfigurasi Kueri.
-
Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan (
) di sebelahnya. Anda dapat melihat informasi berikut:
-
Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin (
). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal (
) untuk menavigasi ke objek S3 yang berisi file.
-
Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam .metadata.json file yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian Metadata dan pemfilteran di. Konfigurasikan dan sesuaikan kueri dan pembuatan respons
Opsi obrolan
-
Untuk menggunakan model yang berbeda untuk menghasilkan respons, Pilih Ubah model. Jika Anda mengubah model, teks di jendela obrolan akan sepenuhnya dihapus.
-
Beralih ke mengambil potongan sumber secara langsung dengan membersihkan Hasilkan respons. Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.
-
Untuk menghapus jendela obrolan, pilih ikon sapu (
).
-
Untuk menyalin semua output di jendela obrolan, pilih ikon salin (
).
- API
-
Untuk menanyakan basis pengetahuan dan menggunakan model dasar untuk menghasilkan respons berdasarkan hasil dari sumber data, kirim RetrieveAndGeneratepermintaan dengan titik akhir waktu proses Agen untuk Amazon Bedrock.
RetrieveAndGenerateStreamAPI mengembalikan data dalam format streaming dan memungkinkan Anda mengakses respons yang dihasilkan dalam potongan tanpa menunggu seluruh hasilnya.
Bidang berikut diperlukan:
Respons API berisi peristiwa kutipan. citationAnggota sudah tidak digunakan lagi. Kami menyarankan Anda menggunakan retrievedReferences bidang generatedResponse dan sebagai gantinya. Untuk referensi, lihat CitationEvent.
| Bidang |
Deskripsi dasar |
| input |
Berisi text bidang untuk menentukan kueri. |
| retrieveAndGenerateKonfigurasi |
Berisi RetrieveAndGenerateConfiguration, yang menentukan konfigurasi untuk pengambilan dan pembuatan. Lihat di bawah untuk lebih jelasnya. |
Bidang berikut adalah opsional:
| Bidang |
Kasus penggunaan |
| sessionId |
Gunakan nilai yang sama dengan sesi sebelumnya untuk melanjutkan sesi itu dan mempertahankan konteksnya untuk model. |
| SessionConfiguration |
Untuk menyertakan kunci KMS kustom untuk enkripsi sesi. |
Sertakan knowledgeBaseConfiguration bidang di RetrieveAndGenerateConfiguration. Bidang ini memetakan ke KnowledgeBaseRetrieveAndGenerateConfigurationobjek, yang berisi bidang-bidang berikut:
Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan rerankingConfiguration bidang di KnowledgeBaseVectorSearchConfigurationdalam. KnowledgeBaseRetrievalConfiguration rerankingConfigurationBidang memetakan ke VectorSearchRerankingConfigurationobjek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat VectorSearchRerankingConfiguration.
Jika Anda numberOfRerankedResults nilai yang Anda tentukan lebih besar dari numberOfResults nilai dalam KnowledgeBaseVectorSearchConfiguration, jumlah maksimum hasil yang akan dikembalikan adalah nilai untuknumberOfResults. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian modifikasi kueri diKonfigurasikan dan sesuaikan kueri dan pembuatan respons. Jika Anda menggunakan dekomposisi kueri, numberOfRerankedResults bisa sampai lima kali. numberOfResults
Respons mengembalikan respons yang dihasilkan di output lapangan dan potongan sumber yang dikutip sebagai array di lapangan. citations Setiap objek Citation berisi bidang-bidang berikut.
| Bidang |
Deskripsi dasar |
| generatedResponsePart |
Di textResponsePart lapangan, kutipan text yang berkaitan dengan disertakan. spanBidang menyediakan indeks untuk awal dan akhir bagian output yang memiliki kutipan. |
| RetrievedReferences |
Array RetrievedReferenceobjek, yang masing-masing berisi potongan sumber, metadata terkait dengan dokumen, dan URI atau URL location dokumen dalam sumber data. content Jika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:. data:image/jpeg;base64,${base64-encoded string} |
Respons juga mengembalikan sessionId nilai, yang dapat Anda gunakan kembali dalam permintaan lain untuk mempertahankan percakapan yang sama.
Jika Anda memasukkan a guardrailConfiguration dalam permintaan, guardrailAction bidang memberi tahu Anda apakah konten diblokir atau tidak.
Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:
Anda tidak dapat memfilter header respons metadata ini saat mengonfigurasi filter metadata.
Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut: