Ikhtisar integrasi Kapan menggunakan integrasi ini Model penyematan yang didukung Prasyarat dan izin Membuat basis pengetahuan dengan Vektor S3 Mengelola dan menanyakan basis pengetahuan Anda Batasan

Menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock

S3 Vectors terintegrasi dengan Amazon Bedrock Knowledge Bases dan Amazon SageMaker AI Unified Studio untuk menyederhanakan dan mengurangi biaya penyimpanan vektor untuk aplikasi pengambilan augmented generation (RAG).

Untuk informasi selengkapnya tentang perintah CLI tingkat tinggi yang mengintegrasikan model penyematan Amazon Bedrock dengan operasi Vektor S3, lihat. Membuat embeddings vektor dan melakukan pencarian semantik dengan s3vectors-embed-cli

Topik

Ikhtisar integrasi
Kapan menggunakan integrasi ini
Model penyematan yang didukung
Prasyarat dan izin
Membuat basis pengetahuan dengan Vektor S3
Mengelola dan menanyakan basis pengetahuan Anda
Batasan

Ikhtisar integrasi

Saat membuat basis pengetahuan di Amazon Bedrock, Anda dapat memilih Vektor S3 sebagai penyimpanan vektor Anda. Integrasi ini menyediakan yang berikut:

Penghematan biaya untuk aplikasi RAG dengan kumpulan data vektor besar.
Integrasi tanpa batas dengan alur kerja RAG Amazon Bedrock yang dikelola sepenuhnya.
Manajemen vektor otomatis ditangani oleh layanan Amazon Bedrock.
Sub-second latensi kueri dingin dan latensi kueri hangat serendah 100 milidetik untuk operasi pengambilan basis pengetahuan.

Amazon Bedrock Knowledge Bases menyediakan alur kerja RAG end-to-end yang dikelola sepenuhnya. Saat Anda membuat basis pengetahuan dengan Vektor S3, Amazon Bedrock secara otomatis mengambil data dari sumber data S3 Anda, mengubah konten menjadi blok teks, menghasilkan embeddings, dan menyimpannya dalam indeks vektor Anda. Anda kemudian dapat menanyakan basis pengetahuan dan menghasilkan respons berdasarkan potongan yang diambil dari data sumber Anda.

Kapan menggunakan integrasi ini

Pertimbangkan untuk menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock saat Anda membutuhkan yang berikut ini:

Cost-effective penyimpanan vektor untuk kumpulan data besar di mana latensi kueri sub-detik memenuhi persyaratan aplikasi Anda.
Pengambilan dokumen berbasis teks dan gambar untuk kasus penggunaan seperti mencari melalui manual, kebijakan, dan konten visual.
Aplikasi RAG yang memprioritaskan pengoptimalan biaya penyimpanan daripada respons latensi ultra-rendah.
Operasi vektor terkelola tanpa perlu mempelajari operasi API Vektor S3 secara langsung - Anda dapat terus menggunakan antarmuka Amazon Bedrock yang sudah dikenal.
Long-term penyimpanan vektor dengan daya tahan dan skalabilitas Amazon S3

Integrasi ini sangat ideal untuk organisasi yang membangun aplikasi RAG yang perlu mencari dan mengekstrak wawasan dari konten dan gambar tertulis, di mana manfaat biaya Vektor S3 selaras dengan persyaratan kinerja kueri yang dapat diterima.

Model penyematan yang didukung

Lihat model yang didukung untuk penyematan vektor di Panduan Pengguna Amazon Bedrock.

Prasyarat dan izin

Sebelum membuat basis pengetahuan dengan Vektor S3, pastikan Anda memiliki yang berikut:

Izin IAM yang sesuai untuk layanan Vektor S3 dan Amazon Bedrock. Untuk informasi selengkapnya tentang izin IAM untuk Vektor S3, lihat. Manajemen Identitas dan Akses di Vektor S3 Untuk informasi selengkapnya tentang izin IAM untuk peran layanan Pangkalan Pengetahuan Amazon Bedrock Anda untuk mengakses Vektor S3, lihat Izin untuk mengakses penyimpanan vektor Anda di Vektor Amazon S3 di Panduan Pengguna Amazon Bedrock.
Dokumen sumber Anda disiapkan untuk masuk ke dalam basis pengetahuan.
Pemahaman tentang persyaratan model embedding Anda.

Saat menyiapkan konfigurasi keamanan, Anda dapat memilih peran IAM yang memberikan izin Amazon Bedrock untuk mengakses layanan yang diperlukan. AWS Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau menggunakan peran kustom Anda sendiri. Jika Anda menggunakan peran kustom, konfigurasikan kebijakan bucket vektor yang membatasi akses ke bucket vektor dan indeks vektor ke peran kustom.

Untuk informasi mendetail tentang izin yang diperlukan dan peran IAM, lihat Membuat peran layanan untuk Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock. Peran layanan juga harus memiliki izin untuk Vektor S3 dan AWS KMS operasi API.

Membuat basis pengetahuan dengan Vektor S3

Anda dapat membuat basis pengetahuan yang menggunakan Vektor S3 melalui dua metode.

Metode satu: Menggunakan konsol Amazon Bedrock

Saat membuat basis pengetahuan di konsol Amazon Bedrock, Anda dapat memilih “bucket vektor S3” sebagai opsi penyimpanan vektor Anda. Anda memiliki dua opsi pengaturan:

Buat toko vektor baru dengan cepat - Amazon Bedrock membuat bucket vektor S3 dan indeks vektor dan mengonfigurasinya dengan pengaturan yang diperlukan untuk Anda. Secara default, bucket vektor dienkripsi menggunakan enkripsi sisi server dengan kunci terkelola Amazon S3 (). SSE-S3 Anda dapat mengenkripsi bucket secara opsional menggunakan. AWS KMS Untuk informasi selengkapnya tentang Cepat membuat penyimpanan vektor baru di konsol, lihat Membuat basis pengetahuan dengan menghubungkan ke sumber data di Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.
Pilih penyimpanan vektor yang telah Anda buat - Pilih bucket vektor S3 dan indeks vektor yang sudah ada dari akun yang telah Anda buat sebelumnya. Untuk informasi selengkapnya tentang membuat bucket vektor S3 dan indeks vektor di konsol Pangkalan Pengetahuan Batuan Dasar Amazon, lihat tab Vektor S3 di Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan di Panduan Pengguna Amazon Bedrock.

Untuk petunjuk langkah demi langkah yang mendetail, lihat Membuat basis pengetahuan dengan menghubungkan ke sumber data di Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.

Metode dua: Menggunakan Amazon SageMaker Unified Studio

Anda juga dapat membuat dan mengelola basis pengetahuan dengan Vektor S3 melalui Amazon Bedrock di Amazon SageMaker AI Unified Studio. Ini menyediakan lingkungan pengembangan terpadu untuk membangun dan menguji aplikasi AI yang menggunakan basis pengetahuan.

Amazon Bedrock di SageMaker AI Unified Studio dirancang untuk pengguna yang membutuhkan kemampuan notebook terintegrasi dan bekerja di beberapa layanan MS dan AWS analitik. Anda dapat dengan cepat membuat bucket vektor S3 dan mengonfigurasinya sebagai penyimpanan vektor untuk basis pengetahuan Anda saat Anda membuat aplikasi AI generatif.

Untuk informasi tentang penggunaan Vektor S3 dengan Amazon Bedrock di SageMaker AI Unified Studio, lihat Menambahkan sumber data ke aplikasi Amazon Bedrock Anda di Panduan Pengguna SageMaker AI Unified Studio.

Mengelola dan menanyakan basis pengetahuan Anda

Sinkronisasi dan manajemen data

Amazon Bedrock Knowledge Bases menawarkan operasi pekerjaan konsumsi untuk menjaga sumber data dan penyematan vektor Anda tetap tersinkronisasi. Saat Anda menyinkronkan sumber data Anda, Amazon Bedrock memindai setiap dokumen dan memverifikasi apakah telah diindeks ke penyimpanan vektor. Anda juga dapat langsung mengindeks dokumen ke dalam penyimpanan vektor menggunakan IngestKnowledgeBaseDocumentsoperasi. Praktik terbaik adalah membuat penyimpanan vektor terpisah untuk setiap basis pengetahuan untuk memastikan sinkronisasi data.

Saat Anda menghapus basis pengetahuan atau sumber daya sumber data, Amazon Bedrock menawarkan dua kebijakan penghapusan data: Delete (default) dan. Retain Jika Anda memilih Delete kebijakan, vektor dalam indeks vektor dan bucket vektor akan dihapus secara otomatis.

Query dan retrieval

Setelah basis pengetahuan Anda diatur, Anda dapat melakukan hal berikut:

Ambil potongan dari data sumber Anda menggunakan operasi Retrieve API.
Hasilkan respons berdasarkan potongan yang diambil menggunakan operasi API. RetrieveAndGenerate
Uji kueri langsung di konsol Amazon Bedrock.

Tanggapan dikembalikan dengan kutipan ke data sumber asli.

Batasan

Saat menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock, Anda harus mengetahui batasan berikut:

Hanya pencarian semantik: Vektor S3 mendukung pencarian semantik tetapi bukan kemampuan pencarian hibrida.
Batas ukuran Vektor S3: Setiap vektor memiliki batas ukuran metadata total dan batas ukuran untuk metadata yang dapat difilter, yang dapat membatasi metadata kustom dan opsi pemfilteran. Saat menggunakan Vektor S3 sebagai penyimpanan vektor Anda dengan Pangkalan Pengetahuan Amazon Bedrock, Anda dapat melampirkan metadata kustom hingga 1KB dan 35 kunci metadata per vektor.
Batasan strategi chunking: Saat menggunakan jumlah token yang sangat tinggi dengan potongan hierarkis di Pangkalan Pengetahuan Batuan Dasar Amazon, Anda dapat melebihi batas ukuran metadata maksimum karena hubungan potongan induk-anak dan konteks hierarkis disimpan sebagai metadata yang tidak dapat difilter di Vektor S3. Untuk informasi selengkapnya tentang batas ukuran metadata per vektor, lihat. Keterbatasan dan pembatasan
Floating-point hanya vektor: Penyematan vektor biner tidak didukung.

Untuk panduan komprehensif tentang bekerja dengan Pangkalan Pengetahuan Amazon Bedrock, lihat Mengambil data dan menghasilkan respons AI dengan Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Menggunakan Vektor S3 dengan Layanan OpenSearch

Wilayah AWS, titik akhir, dan kuota untuk Vektor S3