Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock
catatan
Vektor Amazon S3 sedang dalam rilis pratinjau untuk Amazon Simple Storage Service dan dapat berubah sewaktu-waktu.
S3 Vectors terintegrasi dengan Amazon Bedrock Knowledge Bases dan
Untuk informasi selengkapnya tentang perintah CLI tingkat tinggi yang mengintegrasikan model penyematan Amazon Bedrock dengan operasi Vektor S3, lihat.
Topik
Ikhtisar integrasi
Saat membuat basis pengetahuan di Amazon Bedrock, Anda dapat memilih Vektor S3 sebagai penyimpanan vektor Anda. Integrasi ini menyediakan yang berikut:
-
Penghematan biaya untuk aplikasi RAG dengan kumpulan data vektor besar.
-
Integrasi tanpa batas dengan alur kerja RAG Amazon Bedrock yang dikelola sepenuhnya.
-
Manajemen vektor otomatis ditangani oleh layanan Amazon Bedrock.
-
Latensi kueri sub-detik untuk operasi pengambilan basis pengetahuan.
Amazon Bedrock Knowledge Bases menyediakan alur kerja end-to-end RAG yang dikelola sepenuhnya. Saat Anda membuat basis pengetahuan dengan Vektor S3, Amazon Bedrock secara otomatis mengambil data dari sumber data S3 Anda, mengubah konten menjadi blok teks, menghasilkan penyematan, dan menyimpannya dalam indeks vektor Anda. Anda kemudian dapat menanyakan basis pengetahuan dan menghasilkan respons berdasarkan potongan yang diambil dari data sumber Anda.
Kapan menggunakan integrasi ini
Pertimbangkan untuk menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock saat Anda membutuhkan yang berikut ini:
-
Penyimpanan vektor hemat biaya untuk kumpulan data besar di mana latensi kueri sub-detik memenuhi persyaratan aplikasi Anda.
-
Pengambilan dokumen berbasis teks dan gambar untuk kasus penggunaan seperti mencari melalui manual, kebijakan, dan konten visual.
-
Aplikasi RAG yang memprioritaskan pengoptimalan biaya penyimpanan daripada respons latensi ultra-rendah.
-
Operasi vektor terkelola tanpa perlu mempelajari operasi API Vektor S3 secara langsung - Anda dapat terus menggunakan antarmuka Amazon Bedrock yang sudah dikenal.
-
Penyimpanan vektor jangka panjang dengan daya tahan dan skalabilitas Amazon S3
Integrasi ini sangat ideal untuk organisasi yang membangun aplikasi RAG yang perlu mencari dan mengekstrak wawasan dari konten dan gambar tertulis, di mana manfaat biaya Vektor S3 selaras dengan persyaratan kinerja kueri yang dapat diterima.
Model penyematan yang didukung
Integrasi Vektor S3 dengan Pangkalan Pengetahuan Amazon Bedrock mendukung model penyematan berikut:
-
Amazon. titan-embed-text-v2:0 - Untuk penyematan berbasis teks
-
Amazon. titan-embed-image-v1 - Untuk gambar dan penyematan multimodal
-
berdampingan. embed-english-v3 - Untuk penyematan teks multibahasa dan khusus
Prasyarat dan izin
Sebelum membuat basis pengetahuan dengan Vektor S3, pastikan Anda memiliki yang berikut:
-
Izin IAM yang sesuai untuk layanan Vektor S3 dan Amazon Bedrock. Untuk informasi selengkapnya tentang izin IAM untuk Vektor S3, lihat. Manajemen Identitas dan Akses di Vektor S3 Untuk informasi selengkapnya tentang izin IAM untuk peran layanan Pangkalan Pengetahuan Amazon Bedrock Anda untuk mengakses Vektor S3, lihat Izin untuk mengakses penyimpanan vektor Anda di Vektor Amazon S3 di Panduan Pengguna Amazon Bedrock.
-
Dokumen sumber Anda disiapkan untuk masuk ke dalam basis pengetahuan.
-
Pemahaman tentang persyaratan model embedding Anda.
Saat menyiapkan konfigurasi keamanan, Anda dapat memilih peran IAM yang memberikan izin Amazon Bedrock untuk mengakses layanan yang diperlukan. AWS Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau menggunakan peran kustom Anda sendiri. Jika Anda menggunakan peran kustom, konfigurasikan kebijakan bucket vektor yang membatasi akses ke bucket vektor dan indeks vektor ke peran kustom.
Untuk informasi mendetail tentang izin yang diperlukan dan peran IAM, lihat Membuat peran layanan untuk Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock. Peran layanan juga harus memiliki izin untuk Vektor S3 dan AWS KMS operasi API.
Membuat basis pengetahuan dengan Vektor S3
Anda dapat membuat basis pengetahuan yang menggunakan Vektor S3 melalui dua metode.
Metode satu: Menggunakan konsol Amazon Bedrock
Saat membuat basis pengetahuan di konsol Amazon Bedrock, Anda dapat memilih “bucket vektor S3” sebagai opsi penyimpanan vektor Anda. Anda memiliki dua opsi pengaturan:
-
Buat toko vektor baru dengan cepat - Amazon Bedrock membuat bucket vektor S3 dan indeks vektor dan mengonfigurasinya dengan pengaturan yang diperlukan untuk Anda. Secara default, bucket vektor dienkripsi menggunakan enkripsi sisi server dengan kunci terkelola Amazon S3 (SSE-S3). Anda dapat mengenkripsi bucket secara opsional menggunakan. AWS KMS Untuk informasi selengkapnya tentang Cepat membuat penyimpanan vektor baru di konsol, lihat Membuat basis pengetahuan dengan menghubungkan ke sumber data di Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.
-
Pilih penyimpanan vektor yang telah Anda buat - Pilih bucket vektor S3 dan indeks vektor yang sudah ada dari akun yang telah Anda buat sebelumnya. Untuk informasi selengkapnya tentang membuat bucket vektor S3 dan indeks vektor di konsol Pangkalan Pengetahuan Batuan Dasar Amazon, lihat tab Vektor S3 di Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan di Panduan Pengguna Amazon Bedrock.
Untuk step-by-step petunjuk mendetail, lihat Membuat basis pengetahuan dengan menghubungkan ke sumber data di Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.
Metode dua: Menggunakan Amazon SageMaker Unified Studio
Anda juga dapat membuat dan mengelola basis pengetahuan dengan Vektor S3 melalui Amazon Bedrock di Amazon SageMaker AI
Amazon Bedrock di SageMaker AI Unified Studio
Untuk informasi tentang penggunaan Vektor S3 dengan Amazon Bedrock di SageMaker AI Unified Studio, lihat Menambahkan sumber data ke aplikasi Amazon Bedrock Anda di Panduan Pengguna SageMaker AI Unified Studio.
Mengelola dan menanyakan basis pengetahuan Anda
Sinkronisasi dan manajemen data
Amazon Bedrock Knowledge Bases menawarkan operasi pekerjaan konsumsi untuk menjaga sumber data dan penyematan vektor Anda tetap tersinkronisasi. Saat Anda menyinkronkan sumber data Anda, Amazon Bedrock memindai setiap dokumen dan memverifikasi apakah telah diindeks ke penyimpanan vektor. Anda juga dapat langsung mengindeks dokumen ke dalam penyimpanan vektor menggunakan IngestKnowledgeBaseDocumentsoperasi. Praktik terbaik adalah membuat penyimpanan vektor terpisah untuk setiap basis pengetahuan untuk memastikan sinkronisasi data.
Saat Anda menghapus basis pengetahuan atau sumber daya sumber data, Amazon Bedrock menawarkan dua kebijakan penghapusan data: Delete
(default) dan. Retain
Jika Anda memilih Delete
kebijakan, vektor dalam indeks vektor dan bucket vektor akan dihapus secara otomatis.
Query dan retrieval
Setelah basis pengetahuan Anda diatur, Anda dapat melakukan hal berikut:
-
Ambil potongan dari data sumber Anda menggunakan operasi Retrieve API.
-
Hasilkan respons berdasarkan potongan yang diambil menggunakan operasi API. RetrieveAndGenerate
-
Uji kueri langsung di konsol Amazon Bedrock.
Tanggapan dikembalikan dengan kutipan ke data sumber asli.
Batasan
Saat menggunakan Vektor S3 dengan Basis Pengetahuan Amazon Bedrock, Anda harus mengetahui batasan berikut:
-
Hanya pencarian semantik: Vektor S3 mendukung pencarian semantik tetapi bukan kemampuan pencarian hibrida.
-
Batas ukuran Vektor S3: Setiap vektor memiliki batas ukuran metadata total dan batas ukuran untuk metadata yang dapat difilter, yang dapat membatasi metadata kustom dan opsi pemfilteran. Untuk informasi selengkapnya tentang metadata dan batas ukuran metadata yang dapat difilter per vektor, lihat. Keterbatasan dan pembatasan
-
Kendala strategi chunking: Terbatas pada model yang membagi konten menjadi potongan hingga 500 token karena batasan ukuran metadata.
-
Hanya vektor floating-point: Penyematan vektor biner tidak didukung.
Untuk panduan komprehensif tentang bekerja dengan Pangkalan Pengetahuan Amazon Bedrock, lihat Mengambil data dan menghasilkan respons AI dengan Pangkalan Pengetahuan Amazon Bedrock di Panduan Pengguna Amazon Bedrock.