Kueri basis pengetahuan dan ambil data - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kueri basis pengetahuan dan ambil data

penting

Guardrails diterapkan hanya untuk input dan respon yang dihasilkan dari LLM. Mereka tidak diterapkan pada referensi yang diambil dari Pangkalan Pengetahuan saat runtime.

Setelah basis pengetahuan Anda disiapkan, Anda dapat melakukan kueri dan mengambil potongan dari data sumber yang relevan dengan kueri menggunakan operasi API. Retrieve Anda juga dapat menggunakan model reranking alih-alih ranker Amazon Bedrock Knowledge Bases default untuk memberi peringkat potongan sumber untuk relevansi selama pengambilan.

Untuk mempelajari cara menanyakan basis pengetahuan Anda, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

Console
Untuk menguji basis pengetahuan Anda
  1. Masuk ke Konsol Manajemen AWS dengan identitas IAM yang memiliki izin untuk menggunakan konsol Amazon Bedrock. Kemudian, buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock.

  2. Di panel navigasi kiri, pilih Basis pengetahuan.

  3. Di bagian Basis pengetahuan, lakukan salah satu tindakan berikut:

    • Pilih tombol radio di sebelah basis pengetahuan yang ingin Anda uji dan pilih Uji basis pengetahuan. Jendela uji mengembang dari kanan.

    • Pilih basis pengetahuan yang ingin Anda uji. Jendela uji mengembang dari kanan.

  4. Di jendela pengujian, hapus Hasilkan respons untuk kueri Anda untuk mengembalikan informasi yang diambil langsung dari basis pengetahuan Anda.

  5. (Opsional) Pilih ikon konfigurasi ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) untuk membuka Konfigurasi. Untuk informasi tentang konfigurasi, lihatKonfigurasikan dan sesuaikan kueri dan pembuatan respons.

  6. Masukkan kueri di kotak teks di jendela obrolan dan pilih Jalankan untuk mengembalikan respons dari basis pengetahuan.

  7. Potongan sumber dikembalikan secara langsung sesuai urutan relevansi. Gambar yang diekstrak dari sumber data Anda juga dapat dikembalikan sebagai potongan sumber.

  8. Untuk melihat detail tentang potongan yang dikembalikan, pilih Tampilkan detail sumber.

    • Untuk melihat konfigurasi yang Anda tetapkan untuk kueri, perluas konfigurasi Kueri.

    • Untuk melihat detail tentang potongan sumber, perluas dengan memilih panah kanan ( Play button icon with a triangular shape pointing to the right. ) di sebelahnya. Anda dapat melihat informasi berikut:

      • Teks mentah dari potongan sumber. Untuk menyalin teks ini, pilih ikon salin ( Icon representing a crop or resize function, with two overlapping rectangles. ). Jika Anda menggunakan Amazon S3 untuk menyimpan data Anda, pilih ikon tautan eksternal ( Icon of a square with an arrow pointing outward from its top-right corner. ) untuk menavigasi ke objek S3 yang berisi file.

      • Metadata yang terkait dengan potongan sumber, jika Anda menggunakan Amazon S3 untuk menyimpan data Anda. attribute/field Kunci dan nilai didefinisikan dalam .metadata.json file yang terkait dengan dokumen sumber. Untuk informasi selengkapnya, lihat bagian Metadata dan pemfilteran di. Konfigurasikan dan sesuaikan kueri dan pembuatan respons

Opsi obrolan
  • Beralih ke menghasilkan respons berdasarkan potongan sumber yang diambil dengan mengaktifkan Hasilkan respons. Jika Anda mengubah pengaturan, teks di jendela obrolan akan sepenuhnya dihapus.

  • Untuk menghapus jendela obrolan, pilih ikon sapu ( Magnifying glass icon with a checkmark inside, symbolizing search or inspection. ).

  • Untuk menyalin semua output di jendela obrolan, pilih ikon salin ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Untuk menanyakan basis pengetahuan dan hanya mengembalikan teks yang relevan dari sumber data, kirim Retrievepermintaan dengan titik akhir waktu proses Agen untuk Amazon Bedrock.

Bidang berikut diperlukan:

Bidang Deskripsi dasar
knowledgeBaseId Untuk menentukan basis pengetahuan untuk query.
RetrievalQuery Berisi text bidang untuk menentukan kueri.
GuardrailsConfiguration Sertakan bidang GuardrailsConfiguration seperti guardrailsId dan guardrailsVersion untuk menggunakan pagar pembatas Anda dengan permintaan

Bidang berikut adalah opsional:

Bidang Kasus penggunaan
nextToken Untuk mengembalikan kumpulan tanggapan berikutnya (lihat bidang respons di bawah).
RetrievalConfiguration Untuk menyertakan konfigurasi kueri untuk menyesuaikan pencarian vektor. Untuk informasi selengkapnya, lihat KnowledgeBaseVectorSearchConfiguration.

Anda dapat menggunakan model reranking di atas model peringkat Basis Pengetahuan Amazon Bedrock default dengan menyertakan rerankingConfiguration bidang dalam. KnowledgeBaseVectorSearchConfiguration rerankingConfigurationBidang memetakan ke VectorSearchRerankingConfigurationobjek, di mana Anda dapat menentukan model reranking yang akan digunakan, bidang permintaan tambahan apa pun yang akan disertakan, atribut metadata untuk memfilter dokumen selama penanking ulang, dan jumlah hasil yang akan dikembalikan setelah pencatatan ulang. Untuk informasi selengkapnya, lihat VectorSearchRerankingConfiguration.

catatan

Jika Anda numberOfRerankedResults nilai yang Anda tentukan lebih besar dari numberOfResults nilai dalam KnowledgeBaseVectorSearchConfiguration, jumlah maksimum hasil yang akan dikembalikan adalah nilai untuknumberOfResults. Pengecualian adalah jika Anda menggunakan dekomposisi kueri (untuk informasi selengkapnya, lihat bagian modifikasi kueri diKonfigurasikan dan sesuaikan kueri dan pembuatan respons. Jika Anda menggunakan dekomposisi kueri, numberOfRerankedResults bisa sampai lima kali. numberOfResults

Respons mengembalikan potongan sumber dari sumber data sebagai array KnowledgeBaseRetrievalResultobjek di lapangan. retrievalResults Masing-masing KnowledgeBaseRetrievalResultberisi bidang-bidang berikut:

Bidang Deskripsi
content Berisi potongan sumber teks di text atau potongan sumber gambar di bidang. byteContent Jika konten adalah gambar, URI data dari konten yang disandikan base64 dikembalikan dalam format berikut:. data:image/jpeg;base64,${base64-encoded string}
Metadata Berisi setiap atribut metadata sebagai kunci dan nilai metadata sebagai nilai JSON yang dipetakan kunci.
lokasi Berisi URI atau URL dokumen yang dimiliki potongan sumber.
skor Skor relevansi dokumen. Anda dapat menggunakan skor ini untuk menganalisis peringkat hasil.

Jika jumlah potongan sumber melebihi apa yang bisa muat dalam respons, nilai dikembalikan di nextToken bidang. Gunakan nilai itu dalam permintaan lain untuk mengembalikan kumpulan hasil berikutnya.

Jika data yang diambil berisi gambar, respons juga mengembalikan header respons berikut, yang berisi metadata untuk potongan sumber yang dikembalikan dalam respons:

  • x-amz-bedrock-kb-byte-content-source— Berisi URI Amazon S3 dari gambar.

  • x-amz-bedrock-kb-description— Berisi string yang dikodekan base64 untuk gambar.

catatan

Anda tidak dapat memfilter header respons metadata ini saat mengonfigurasi filter metadata.

Kueri multimodal

Untuk basis pengetahuan yang menggunakan model penyematan multimodal, Anda dapat melakukan kueri dengan gambar selain teks. retrievalQueryBidang ini mendukung multimodalInputList bidang untuk kueri gambar:

catatan

Untuk panduan komprehensif tentang pengaturan dan bekerja dengan basis pengetahuan multimodal, termasuk memilih antara pendekatan Nova dan BDA, lihat. Membangun basis pengetahuan untuk konten multimodal

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "text": "Find similar shoes", "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

Anda juga dapat melakukan kueri dengan gambar hanya dengan menghilangkan text bidang:

{ "knowledgeBaseId": "EXAMPLE123", "retrievalQuery": { "multimodalInputList": [ { "content": { "byteContent": "base64-encoded-image-data" }, "modality": "IMAGE" } ] } }

Pola kueri multimodal umum

Image-to-image pencarian

Unggah gambar untuk menemukan gambar yang mirip secara visual. Contoh: Unggah foto sepatu Nike merah untuk menemukan sepatu serupa di katalog produk Anda.

Teks+penyempurnaan gambar

Gabungkan teks dan gambar untuk hasil yang lebih tepat. Contoh: “Temukan sepatu serupa tetapi dengan warna berbeda” bersama dengan gambar sepatu yang diunggah.

Pencarian dokumen visual

Cari bagan, diagram, atau elemen visual dalam dokumen. Contoh: Unggah gambar bagan untuk menemukan bagan serupa di koleksi dokumen Anda.

Memilih antara Nova dan BDA untuk konten multimodal

Saat bekerja dengan konten multimodal, pilih pendekatan Anda berdasarkan jenis konten dan pola kueri Anda:

Matriks Keputusan Nova vs BDA
Jenis Konten Gunakan Embeddings Nova Multimodal Gunakan Parser Otomasi Data Batuan Dasar (BDA)
Konten Video Fokus mendongeng visual (olahraga, iklan, demonstrasi), pertanyaan tentang elemen visual, konten ucapan minimal Penting speech/narration (presentasi, rapat, tutorial), pertanyaan tentang konten lisan, perlu transkrip
Konten Audio Identifikasi musik atau efek suara, analisis audio non-ucapan Podcast, wawancara, rapat, konten apa pun dengan pidato yang membutuhkan transkripsi
Konten Gambar Pencarian kesamaan visual, image-to-image pengambilan, analisis konten visual Ekstraksi teks dari gambar, pemrosesan dokumen, persyaratan OCR
catatan

Penyematan multimodal Nova tidak dapat memproses konten ucapan secara langsung. Jika file audio atau video Anda berisi informasi lisan yang penting, gunakan parser BDA untuk mengonversi ucapan menjadi teks terlebih dahulu, atau pilih model penyematan teks sebagai gantinya.

Keterbatasan kueri multimodal

  • Maksimum satu gambar per kueri dalam rilis saat ini

  • Kueri gambar hanya didukung dengan model penyematan multimodal (Titan G1 atau Cohere Embed v3)

  • RetrieveAndGenerate API tidak didukung untuk basis pengetahuan dengan model penyematan multimodal dan bucket konten S3

  • Jika Anda memberikan kueri gambar ke basis pengetahuan menggunakan model penyematan khusus teks, kesalahan 4xx akan dikembalikan

Struktur respons API multimodal

Respons pengambilan untuk konten multimodal mencakup metadata tambahan:

  • URI Sumber: Menunjuk ke lokasi bucket S3 asli Anda

  • URI Tambahan: Menunjuk ke salinan di bucket penyimpanan multimodal Anda

  • Metadata stempel waktu: Termasuk untuk potongan video dan audio untuk memungkinkan pemosisian pemutaran yang tepat

catatan

Saat menggunakan API atau SDK, Anda harus menangani pengambilan file dan navigasi stempel waktu di aplikasi Anda. Konsol menangani ini secara otomatis dengan pemutaran video yang disempurnakan dan navigasi stempel waktu otomatis.

catatan

Jika Anda menerima kesalahan bahwa prompt melebihi batas karakter saat menghasilkan respons, Anda dapat mempersingkat prompt dengan cara berikut: