Menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock - Amazon Simple Storage Service

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock

catatan

Vektor Amazon S3 sedang dalam rilis pratinjau untuk Amazon Simple Storage Service dan dapat berubah sewaktu-waktu.

S3 Vectors terintegrasi dengan Amazon Bedrock Knowledge Bases dan Amazon SageMaker AI Unified Studio untuk menyederhanakan dan mengurangi biaya penyimpanan vektor untuk aplikasi pengambilan augmented generation (RAG).

Untuk informasi selengkapnya tentang perintah CLI tingkat tinggi yang mengintegrasikan model penyematan Amazon Bedrock dengan operasi Vektor S3, lihat.

Ikhtisar integrasi

Saat membuat basis pengetahuan di Amazon Bedrock, Anda dapat memilih Vektor S3 sebagai penyimpanan vektor Anda. Integrasi ini menyediakan yang berikut:

  • Penghematan biaya untuk aplikasi RAG dengan kumpulan data vektor besar.

  • Integrasi tanpa batas dengan alur kerja RAG Amazon Bedrock yang dikelola sepenuhnya.

  • Manajemen vektor otomatis ditangani oleh layanan Amazon Bedrock.

  • Latensi kueri sub-detik untuk operasi pengambilan basis pengetahuan.

Amazon Bedrock Knowledge Bases menyediakan alur kerja end-to-end RAG yang dikelola sepenuhnya. Saat Anda membuat basis pengetahuan dengan Vektor S3, Amazon Bedrock secara otomatis mengambil data dari sumber data S3 Anda, mengubah konten menjadi blok teks, menghasilkan penyematan, dan menyimpannya dalam indeks vektor Anda. Anda kemudian dapat menanyakan basis pengetahuan dan menghasilkan respons berdasarkan potongan yang diambil dari data sumber Anda.

Kapan menggunakan integrasi ini

Pertimbangkan untuk menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock saat Anda membutuhkan yang berikut ini:

  • Penyimpanan vektor hemat biaya untuk kumpulan data besar di mana latensi kueri sub-detik memenuhi persyaratan aplikasi Anda.

  • Pengambilan dokumen berbasis teks dan gambar untuk kasus penggunaan seperti mencari melalui manual, kebijakan, dan konten visual.

  • Aplikasi RAG yang memprioritaskan pengoptimalan biaya penyimpanan daripada respons latensi ultra-rendah.

  • Operasi vektor terkelola tanpa perlu mempelajari operasi API Vektor S3 secara langsung - Anda dapat terus menggunakan antarmuka Amazon Bedrock yang sudah dikenal.

  • Penyimpanan vektor jangka panjang dengan daya tahan dan skalabilitas Amazon S3

Integrasi ini sangat ideal untuk organisasi yang membangun aplikasi RAG yang perlu mencari dan mengekstrak wawasan dari konten dan gambar tertulis, di mana manfaat biaya Vektor S3 selaras dengan persyaratan kinerja kueri yang dapat diterima.

Model penyematan yang didukung

Integrasi Vektor S3 dengan Pangkalan Pengetahuan Amazon Bedrock mendukung model penyematan berikut:

  • Amazon. titan-embed-text-v2:0 - Untuk penyematan berbasis teks

  • Amazon. titan-embed-image-v1 - Untuk gambar dan penyematan multimodal

  • berdampingan. embed-english-v3 - Untuk penyematan teks multibahasa dan khusus

Prasyarat dan izin

Sebelum membuat basis pengetahuan dengan Vektor S3, pastikan Anda memiliki yang berikut:

Saat menyiapkan konfigurasi keamanan, Anda dapat memilih peran IAM yang memberikan izin Amazon Bedrock untuk mengakses layanan yang diperlukan. AWS Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau menggunakan peran kustom Anda sendiri. Jika Anda menggunakan peran kustom, konfigurasikan kebijakan bucket vektor yang membatasi akses ke bucket vektor dan indeks vektor ke peran kustom.

Untuk informasi mendetail tentang izin yang diperlukan dan peran IAM, lihat Membuat peran layanan untuk Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock. Peran layanan juga harus memiliki izin untuk Vektor S3 dan AWS KMS operasi API.

Membuat basis pengetahuan dengan Vektor S3

Anda dapat membuat basis pengetahuan yang menggunakan Vektor S3 melalui dua metode.

Metode satu: Menggunakan konsol Amazon Bedrock

Saat membuat basis pengetahuan di konsol Amazon Bedrock, Anda dapat memilih “bucket vektor S3” sebagai opsi penyimpanan vektor Anda. Anda memiliki dua opsi pengaturan:

Untuk step-by-step petunjuk mendetail, lihat Membuat basis pengetahuan dengan menghubungkan ke sumber data di Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.

Metode dua: Menggunakan Amazon SageMaker Unified Studio

Anda juga dapat membuat dan mengelola basis pengetahuan dengan Vektor S3 melalui Amazon Bedrock di Amazon SageMaker AI Unified Studio. Ini menyediakan lingkungan pengembangan terpadu untuk membangun dan menguji aplikasi AI yang menggunakan basis pengetahuan.

Amazon Bedrock di SageMaker AI Unified Studio dirancang untuk pengguna yang membutuhkan kemampuan notebook terintegrasi dan bekerja di beberapa layanan MS dan AWS analitik. Anda dapat dengan cepat membuat bucket vektor S3 dan mengonfigurasinya sebagai penyimpanan vektor untuk basis pengetahuan Anda saat Anda membuat aplikasi AI generatif.

Untuk informasi tentang penggunaan Vektor S3 dengan Amazon Bedrock di SageMaker AI Unified Studio, lihat Menambahkan sumber data ke aplikasi Amazon Bedrock Anda di Panduan Pengguna SageMaker AI Unified Studio.

Mengelola dan menanyakan basis pengetahuan Anda

Sinkronisasi dan manajemen data

Amazon Bedrock Knowledge Bases menawarkan operasi pekerjaan konsumsi untuk menjaga sumber data dan penyematan vektor Anda tetap tersinkronisasi. Saat Anda menyinkronkan sumber data Anda, Amazon Bedrock memindai setiap dokumen dan memverifikasi apakah telah diindeks ke penyimpanan vektor. Anda juga dapat langsung mengindeks dokumen ke dalam penyimpanan vektor menggunakan IngestKnowledgeBaseDocumentsoperasi. Praktik terbaik adalah membuat penyimpanan vektor terpisah untuk setiap basis pengetahuan untuk memastikan sinkronisasi data.

Saat Anda menghapus basis pengetahuan atau sumber daya sumber data, Amazon Bedrock menawarkan dua kebijakan penghapusan data: Delete (default) dan. Retain Jika Anda memilih Delete kebijakan, vektor dalam indeks vektor dan bucket vektor akan dihapus secara otomatis.

Query dan retrieval

Setelah basis pengetahuan Anda diatur, Anda dapat melakukan hal berikut:

  • Ambil potongan dari data sumber Anda menggunakan operasi Retrieve API.

  • Hasilkan respons berdasarkan potongan yang diambil menggunakan operasi API. RetrieveAndGenerate

  • Uji kueri langsung di konsol Amazon Bedrock.

Tanggapan dikembalikan dengan kutipan ke data sumber asli.

Batasan

Saat menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock, Anda harus mengetahui batasan berikut:

  • Hanya pencarian semantik: Vektor S3 mendukung pencarian semantik tetapi bukan kemampuan pencarian hibrida.

  • Batas ukuran Vektor S3: Setiap vektor memiliki batas ukuran metadata total dan batas ukuran untuk metadata yang dapat difilter, yang dapat membatasi metadata kustom dan opsi pemfilteran. Untuk informasi selengkapnya tentang metadata dan batas ukuran metadata yang dapat difilter per vektor, lihat. Keterbatasan dan pembatasan

  • Kendala strategi chunking: Terbatas pada model yang membagi konten menjadi potongan hingga 500 token karena batasan ukuran metadata.

  • Hanya vektor floating-point: Penyematan vektor biner tidak didukung.

Untuk panduan komprehensif tentang bekerja dengan Pangkalan Pengetahuan Amazon Bedrock, lihat Mengambil data dan menghasilkan respons AI dengan Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.