Database vektor individu Layanan terkelola - Basis Pengetahuan Amazon Bedrock Memilih antara opsi individu dan terkelola

Perbandingan basis data vektor

AWS menyediakan beberapa pendekatan untuk menerapkan kemampuan pencarian vektor, mulai dari database vektor individual hingga Pangkalan Pengetahuan Amazon Bedrock, yang merupakan layanan yang dikelola sepenuhnya. Saat mengevaluasi opsi ini, organisasi harus mempertimbangkan berbagai aspek termasuk arsitektur, skalabilitas, kemampuan integrasi, karakteristik kinerja, dan fitur keamanan.

Database vektor individu

Tabel berikut memberikan ikhtisar fitur utama dari beberapa solusi database vektor AWS individu, dengan fokus pada arsitekturnya, kemampuan penskalaan, integrasi sumber data, dan karakteristik kinerja.

Fitur	Amazon Kendra	OpenSearch Layanan Amazon	Amazon RDS untuk SQLwith Postgre pgvector	Amazon DocumentDB	Amazon MemoryDB	Analisis Amazon Neptunus	Vektor Amazon S3
Kasus penggunaan primer	Pencarian perusahaan dan RAG	Pencarian dan analitik terdistribusi	Relasional DB dengan dukungan vektor	Dokumen DB dengan pencarian vektor	Pencarian vektor dalam memori waktu nyata	Analisis grafik dengan pencarian vektor	Penyimpanan vektor yang dioptimalkan biaya
Arsitektur	Dikelola sepenuhnya	Cluster terdistribusi	Basis data relasional	Berorientasi dokumen	Basis data dalam memori	Mesin analisis grafik	Penyimpanan objek tanpa server
Model Data	Berbasis dokumen	Dokumen JSON	Tabel relasional	Dokumen JSON	Nilai kunci dengan JSON	Grafik properti	Penyimpanan objek
Dimensi vektor	Dikelola secara otomatis	Hingga 16.000	Dapat dikonfigurasi	Hingga 2.000 (diindeks); 16.000 (tidak diindeks)	Hingga 32.768	Dapat dikonfigurasi	Hingga 4.096
Metode pengindeksan	Otomatis	HNSW, IVF	HNSW, IVFFlat	HNSW, IVFFlat	HNSW	Grafik dan vektor asli	Otomatis
Metrik jarak	Otomatis	Cosine, Euclidean, produk dot	Cosine, Euclidean, produk dalam	Cosine, Euclidean, produk dot	Cosine, Euclidean, produk dalam	Kosinus, Euclidean	Kosinus, Euclidean
Latensi kueri	Sub-detik	Sub-10 ms (dipercepat GPU)	10-100 ms	Milidetik	Sub-milidetik	Sub-detik	Sub-100 ms
Model penskalaan	Otomatis	Horisontal (tambahkan node)	Replika vertikal dan baca	Horizontal (tambahkan contoh)	Vertikal dan replika	Otomatis	Otomatis (tanpa server)
Vektor maksimum	Dikelola	Miliaran (tergantung cluster)	Jutaan (tergantung instans)	Jutaan per koleksi	Jutaan per database	Miliaran	2 miliar per indeks; 10.000 indeks per ember
Throughput	Tinggi	Sangat tinggi (ribuan QPS)	Sedang	Tinggi	Sangat tinggi (jutaan permintaan per hari)	Tinggi	Medium (dioptimalkan untuk kueri yang jarang)
Daya tahan data	99,999999999% (11 9 detik)	Dapat dikonfigurasi dengan replika	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99% (Multi-AZ)	99,99%	99,999999999% (11 9 detik)
Model konsistensi	Akhirnya	Akhirnya (dapat dikonfigurasi)	Kuat (ACID)	Akhirnya	Kuat	Kuat	Kuat
Kemampuan tambahan	40 atau lebih konektor data, NLP	Pencarian teks lengkap, analitik, dasbor	Kueri SQL, transaksi ACID	Kompatibilitas API MongoDB	Kompatibilitas Redis API, caching	Algoritma grafik, traversal	Integrasi Amazon S3, kebijakan siklus hidup
Model penentuan harga	Bayar per kueri dan penyimpanan	Jam dan penyimpanan instans	Jam dan penyimpanan instans	Jam dan penyimpanan instans	Jam dan penyimpanan instans	Unit kapasitas dan penyimpanan	Penyimpanan, kueri, dan transfer data
Optimalisasi biaya	Berbasis penggunaan	Contoh cadangan, auto-scaling	Contoh yang dicadangkan, Aurora Tanpa Server	Instans cadangan	Instans cadangan	Penskalaan otomatis	Penghematan hingga 90% vs khusus DBs
Terbaik untuk	Pencarian perusahaan dengan pengaturan minimal	Kueri throughput tinggi, latensi rendah	Hybrid SQL dan beban kerja vektor	Aplikasi yang kompatibel dengan MongoDB yang membutuhkan vektor	Aplikasi real-time, latensi ultra-rendah	GraphRag dan grafik pengetahuan	Penyimpanan jangka panjang dan hemat biaya
Pola kueri yang ideal	Pencarian perusahaan yang sering	Kueri real-time frekuensi tinggi	SQL campuran dan kueri vektor	Kueri dokumen dengan pencarian semantik	Jutaan permintaan per hari	Grafik traversal dengan pencarian vektor	Pertanyaan yang jarang terjadi (menit hingga jam)
Kompleksitas pengaturan	Rendah (dikelola sepenuhnya)	Sedang (konfigurasi cluster)	Sedang (pengaturan ekstensi)	Sedang (konfigurasi cluster)	Sedang (konfigurasi cluster)	Rendah (dikelola sepenuhnya)	Rendah (tanpa server)
Diperlukan keahlian tim	Minimal	OpenSearch atau Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	Database grafik	Amazon S3, konsep vektor dasar

Layanan terkelola - Basis Pengetahuan Amazon Bedrock

Amazon Bedrock Knowledge Bases menyediakan solusi yang dikelola sepenuhnya dengan beberapa opsi penyimpanan vektor. Tabel berikut membandingkan opsi penyimpanan ini.

Fitur	Aurora Postgre pgvektor SQLwith	Analisis Neptunus	OpenSearch Layanan Tanpa Server	Vektor Amazon S3	Biji pinus	RedisEnterprise Awan
Kasus penggunaan primer	Relasional DB dengan vektor RAG	Pencarian vektor berbasis grafik untuk GraphRag	Manajemen pengetahuan RAG	Vektor RAG yang dioptimalkan biaya	Pencarian vektor kinerja tinggi	Pencarian vektor dalam memori
Arsitektur	Relasional yang dikelola sepenuhnya	Analisis grafik yang dikelola sepenuhnya	Tanpa server yang dikelola sepenuhnya	Penyimpanan objek tanpa server	Cloud hybrid yang dikelola sepenuhnya	Dikelola sepenuhnya dalam memori
Model Data	Tabel relasional	Grafik properti	Dokumen JSON	Penyimpanan objek	Vektor yang dibuat khusus	Nilai kunci dengan vektor
Penyimpanan vektor	Melalui ekstensi pgvector	Vektor grafik asli	Melalui OpenSearch mesin	Penyimpanan vektor Amazon S3 asli	Database vektor asli	Vektor dalam memori
Integrasi Amazon Bedrock	Asli	Asli	Asli	Asli	Asli	Asli
Konsumsi otomatis	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)
Vektorisasi otomatis	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)	Ya (melalui Amazon Bedrock)
Penskalaan	Penskalaan otomatis (Aurora Tanpa Server)	Penskalaan grafik otomatis	Otomatis tanpa server	Otomatis (miliaran vektor)	Pod penskalaan otomatis	Cluster penskalaan otomatis
Kinerja kueri	Tinggi untuk relasional atau vektor	Tinggi untuk vektor grafik	Tinggi	Sedang (100 ms atau lebih latensi)	Sangat tinggi	Sangat tinggi
Vektor maksimum	Jutaan (tergantung instans)	Miliaran	Miliaran	2 miliar per indeks	Miliaran	Jutaan (tergantung memori)
Kemampuan tambahan	Kueri SQL, transaksi ACID	Algoritma grafik, traversal	Pencarian teks lengkap, analitik	Siklus hidup Amazon S3, tingkat	Pemfilteran metadata, ruang nama	Struktur data Redis, caching
Optimalisasi biaya	Moderat (Aurora Tanpa Server)	Sedang (unit kapasitas)	Tinggi (tanpa server,) pay-per-use	Sangat tinggi (penghematan hingga 90%)	Sedang (harga berbasis pod)	Rendah (premium dalam memori)
Terbaik untuk	Beban SQL/vector kerja hibrida	Grafik pengetahuan yang terhubung	Teks lengkap dengan pencarian vektor	Vektor jangka panjang dan jarang diakses	Pencarian vektor real-time pada skala	Kebutuhan latensi sangat rendah
Pola kueri yang ideal	SQL campuran dan kueri vektor	Grafik traversal dengan vektor	Pencarian yang sering dilakukan dengan analitik	Pengambilan yang jarang (menit hingga jam)	Kueri real-time frekuensi tinggi	Jutaan permintaan per detik
Pengaturan dengan Amazon Bedrock	Sederhana (dikelola oleh Amazon Bedrock)	Sederhana (dikelola oleh Amazon Bedrock)	Sederhana (dikelola oleh Amazon Bedrock)	Sederhana (dikelola oleh Amazon Bedrock)	Sederhana (dikelola oleh Amazon Bedrock)	Sederhana (dikelola oleh Amazon Bedrock)
Data residensi	Wilayah AWS	Wilayah AWS	Wilayah AWS	Wilayah AWS	Multi-cloud (AWS dan lainnya)	Multi-cloud (AWS dan lainnya)
Model penentuan harga	Jam dan penyimpanan instans	Unit kapasitas dan penyimpanan	Komputasi dan penyimpanan (tanpa server)	Penyimpanan, kueri, dan transfer	Jam dan penyimpanan pod	Jam dan penyimpanan node

Memilih antara opsi individu dan terkelola

Pertimbangan	Pilih vektor individu DB	Pilih Pangkalan Pengetahuan Amazon Bedrock (dikelola)
Implementasi RAG	Anda ingin kontrol penuh atas pipa RAG	Anda ingin RAG yang dikelola sepenuhnya dengan pengaturan minimal
Kustomisasi	Anda memerlukan logika pengambilan khusus dan preprocessing	Pola RAG standar memenuhi kebutuhan Anda
Infrastruktur yang ada	Anda sudah memiliki database yang digunakan	Anda mulai segar atau ingin manajemen yang disederhanakan
Keahlian tim	Tim Anda memiliki keahlian administrasi database	Anda lebih suka fokus pada logika aplikasi, bukan infrastruktur
Kompleksitas integrasi	Anda membutuhkan integrasi mendalam dengan sistem yang ada	Anda ingin integrasi cepat dengan model Amazon Bedrock
Overhead operasional	Anda dapat mengelola operasi database	Anda AWS ingin menangani operasi
Struktur biaya	Anda lebih suka harga database langsung	Anda lebih suka harga Amazon Bedrock terpadu
Waktunya ke pasar	Anda punya waktu untuk implementasi khusus	Anda membutuhkan penyebaran yang cepat

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Opsi basis data vektor

Perbandingan biaya dan pertimbangan