Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Perbandingan basis data vektor
AWS menyediakan beberapa pendekatan untuk menerapkan kemampuan pencarian vektor, mulai dari database vektor individual hingga Pangkalan Pengetahuan Amazon Bedrock, yang merupakan layanan yang dikelola sepenuhnya. Saat mengevaluasi opsi ini, organisasi harus mempertimbangkan berbagai aspek termasuk arsitektur, skalabilitas, kemampuan integrasi, karakteristik kinerja, dan fitur keamanan.
Database vektor individu
Tabel berikut memberikan ikhtisar fitur utama dari beberapa solusi database vektor AWS individu, dengan fokus pada arsitekturnya, kemampuan penskalaan, integrasi sumber data, dan karakteristik kinerja.
Fitur |
Amazon Kendra |
OpenSearch Layanan Amazon |
Amazon RDS untuk SQLwith Postgre pgvector |
Amazon DocumentDB |
Amazon MemoryDB |
Analisis Amazon Neptunus |
Vektor Amazon S3 |
|---|---|---|---|---|---|---|---|
Kasus penggunaan primer |
Pencarian perusahaan dan RAG |
Pencarian dan analitik terdistribusi |
Relasional DB dengan dukungan vektor |
Dokumen DB dengan pencarian vektor |
Pencarian vektor dalam memori waktu nyata |
Analisis grafik dengan pencarian vektor |
Penyimpanan vektor yang dioptimalkan biaya |
Arsitektur |
Dikelola sepenuhnya |
Cluster terdistribusi |
Basis data relasional |
Berorientasi dokumen |
Basis data dalam memori |
Mesin analisis grafik |
Penyimpanan objek tanpa server |
Model Data |
Berbasis dokumen |
Dokumen JSON |
Tabel relasional |
Dokumen JSON |
Nilai kunci dengan JSON |
Grafik properti |
Penyimpanan objek |
Dimensi vektor |
Dikelola secara otomatis |
Hingga 16.000 |
Dapat dikonfigurasi |
Hingga 2.000 (diindeks); 16.000 (tidak diindeks) |
Hingga 32.768 |
Dapat dikonfigurasi |
Hingga 4.096 |
Metode pengindeksan |
Otomatis |
HNSW, IVF |
HNSW, IVFFlat |
HNSW, IVFFlat |
HNSW |
Grafik dan vektor asli |
Otomatis |
Metrik jarak |
Otomatis |
Cosine, Euclidean, produk dot |
Cosine, Euclidean, produk dalam |
Cosine, Euclidean, produk dot |
Cosine, Euclidean, produk dalam |
Kosinus, Euclidean |
Kosinus, Euclidean |
Latensi kueri |
Sub-detik |
Sub-10 ms (dipercepat GPU) |
10-100 ms |
Milidetik |
Sub-milidetik |
Sub-detik |
Sub-100 ms |
Model penskalaan |
Otomatis |
Horisontal (tambahkan node) |
Replika vertikal dan baca |
Horizontal (tambahkan contoh) |
Vertikal dan replika |
Otomatis |
Otomatis (tanpa server) |
Vektor maksimum |
Dikelola |
Miliaran (tergantung cluster) |
Jutaan (tergantung instans) |
Jutaan per koleksi |
Jutaan per database |
Miliaran |
2 miliar per indeks; 10.000 indeks per ember |
Throughput |
Tinggi |
Sangat tinggi (ribuan QPS) |
Sedang |
Tinggi |
Sangat tinggi (jutaan permintaan per hari) |
Tinggi |
Medium (dioptimalkan untuk kueri yang jarang) |
Daya tahan data |
99,999999999% (11 9 detik) |
Dapat dikonfigurasi dengan replika |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% (Multi-AZ) |
99,99% |
99,999999999% (11 9 detik) |
Model konsistensi |
Akhirnya |
Akhirnya (dapat dikonfigurasi) |
Kuat (ACID) |
Akhirnya |
Kuat |
Kuat |
Kuat |
Kemampuan tambahan |
40 atau lebih konektor data, NLP |
Pencarian teks lengkap, analitik, dasbor |
Kueri SQL, transaksi ACID |
Kompatibilitas API MongoDB |
Kompatibilitas Redis API, caching |
Algoritma grafik, traversal |
Integrasi Amazon S3, kebijakan siklus hidup |
Model penentuan harga |
Bayar per kueri dan penyimpanan |
Jam dan penyimpanan instans |
Jam dan penyimpanan instans |
Jam dan penyimpanan instans |
Jam dan penyimpanan instans |
Unit kapasitas dan penyimpanan |
Penyimpanan, kueri, dan transfer data |
Optimalisasi biaya |
Berbasis penggunaan |
Contoh cadangan, auto-scaling |
Contoh yang dicadangkan, Aurora Tanpa Server |
Instans cadangan |
Instans cadangan |
Penskalaan otomatis |
Penghematan hingga 90% vs khusus DBs |
Terbaik untuk |
Pencarian perusahaan dengan pengaturan minimal |
Kueri throughput tinggi, latensi rendah |
Hybrid SQL dan beban kerja vektor |
Aplikasi yang kompatibel dengan MongoDB yang membutuhkan vektor |
Aplikasi real-time, latensi ultra-rendah |
GraphRag dan grafik pengetahuan |
Penyimpanan jangka panjang dan hemat biaya |
Pola kueri yang ideal |
Pencarian perusahaan yang sering |
Kueri real-time frekuensi tinggi |
SQL campuran dan kueri vektor |
Kueri dokumen dengan pencarian semantik |
Jutaan permintaan per hari |
Grafik traversal dengan pencarian vektor |
Pertanyaan yang jarang terjadi (menit hingga jam) |
Kompleksitas pengaturan |
Rendah (dikelola sepenuhnya) |
Sedang (konfigurasi cluster) |
Sedang (pengaturan ekstensi) |
Sedang (konfigurasi cluster) |
Sedang (konfigurasi cluster) |
Rendah (dikelola sepenuhnya) |
Rendah (tanpa server) |
Diperlukan keahlian tim |
Minimal |
OpenSearch atau Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
Database grafik |
Amazon S3, konsep vektor dasar |
Layanan terkelola - Basis Pengetahuan Amazon Bedrock
Amazon Bedrock Knowledge Bases menyediakan solusi yang dikelola sepenuhnya dengan beberapa opsi penyimpanan vektor. Tabel berikut membandingkan opsi penyimpanan ini.
Fitur |
Aurora Postgre pgvektor SQLwith |
Analisis Neptunus |
OpenSearch Layanan Tanpa Server |
Vektor Amazon S3 |
Biji pinus |
RedisEnterprise Awan |
|---|---|---|---|---|---|---|
Kasus penggunaan primer |
Relasional DB dengan vektor RAG |
Pencarian vektor berbasis grafik untuk GraphRag |
Manajemen pengetahuan RAG |
Vektor RAG yang dioptimalkan biaya |
Pencarian vektor kinerja tinggi |
Pencarian vektor dalam memori |
Arsitektur |
Relasional yang dikelola sepenuhnya |
Analisis grafik yang dikelola sepenuhnya |
Tanpa server yang dikelola sepenuhnya |
Penyimpanan objek tanpa server |
Cloud hybrid yang dikelola sepenuhnya |
Dikelola sepenuhnya dalam memori |
Model Data |
Tabel relasional |
Grafik properti |
Dokumen JSON |
Penyimpanan objek |
Vektor yang dibuat khusus |
Nilai kunci dengan vektor |
Penyimpanan vektor |
Melalui ekstensi pgvector |
Vektor grafik asli |
Melalui OpenSearch mesin |
Penyimpanan vektor Amazon S3 asli |
Database vektor asli |
Vektor dalam memori |
Integrasi Amazon Bedrock |
Asli |
Asli |
Asli |
Asli |
Asli |
Asli |
Konsumsi otomatis |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Vektorisasi otomatis |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Ya (melalui Amazon Bedrock) |
Penskalaan |
Penskalaan otomatis (Aurora Tanpa Server) |
Penskalaan grafik otomatis |
Otomatis tanpa server |
Otomatis (miliaran vektor) |
Pod penskalaan otomatis |
Cluster penskalaan otomatis |
Kinerja kueri |
Tinggi untuk relasional atau vektor |
Tinggi untuk vektor grafik |
Tinggi |
Sedang (100 ms atau lebih latensi) |
Sangat tinggi |
Sangat tinggi |
Vektor maksimum |
Jutaan (tergantung instans) |
Miliaran |
Miliaran |
2 miliar per indeks |
Miliaran |
Jutaan (tergantung memori) |
Kemampuan tambahan |
Kueri SQL, transaksi ACID |
Algoritma grafik, traversal |
Pencarian teks lengkap, analitik |
Siklus hidup Amazon S3, tingkat |
Pemfilteran metadata, ruang nama |
Struktur data Redis, caching |
Optimalisasi biaya |
Moderat (Aurora Tanpa Server) |
Sedang (unit kapasitas) |
Tinggi (tanpa server,) pay-per-use |
Sangat tinggi (penghematan hingga 90%) |
Sedang (harga berbasis pod) |
Rendah (premium dalam memori) |
Terbaik untuk |
Beban SQL/vector kerja hibrida |
Grafik pengetahuan yang terhubung |
Teks lengkap dengan pencarian vektor |
Vektor jangka panjang dan jarang diakses |
Pencarian vektor real-time pada skala |
Kebutuhan latensi sangat rendah |
Pola kueri yang ideal |
SQL campuran dan kueri vektor |
Grafik traversal dengan vektor |
Pencarian yang sering dilakukan dengan analitik |
Pengambilan yang jarang (menit hingga jam) |
Kueri real-time frekuensi tinggi |
Jutaan permintaan per detik |
Pengaturan dengan Amazon Bedrock |
Sederhana (dikelola oleh Amazon Bedrock) |
Sederhana (dikelola oleh Amazon Bedrock) |
Sederhana (dikelola oleh Amazon Bedrock) |
Sederhana (dikelola oleh Amazon Bedrock) |
Sederhana (dikelola oleh Amazon Bedrock) |
Sederhana (dikelola oleh Amazon Bedrock) |
Data residensi |
Region AWS |
Region AWS |
Region AWS |
Region AWS |
Multi-cloud (AWS dan lainnya) |
Multi-cloud (AWS dan lainnya) |
Model penentuan harga |
Jam dan penyimpanan instans |
Unit kapasitas dan penyimpanan |
Komputasi dan penyimpanan (tanpa server) |
Penyimpanan, kueri, dan transfer |
Jam dan penyimpanan pod |
Jam dan penyimpanan node |
Memilih antara opsi individu dan terkelola
Pertimbangan |
Pilih vektor individu DB |
Pilih Pangkalan Pengetahuan Amazon Bedrock (dikelola) |
|---|---|---|
Implementasi RAG |
Anda ingin kontrol penuh atas pipa RAG |
Anda ingin RAG yang dikelola sepenuhnya dengan pengaturan minimal |
Kustomisasi |
Anda memerlukan logika pengambilan khusus dan preprocessing |
Pola RAG standar memenuhi kebutuhan Anda |
Infrastruktur yang ada |
Anda sudah memiliki database yang digunakan |
Anda mulai segar atau ingin manajemen yang disederhanakan |
Keahlian tim |
Tim Anda memiliki keahlian administrasi database |
Anda lebih suka fokus pada logika aplikasi, bukan infrastruktur |
Kompleksitas integrasi |
Anda membutuhkan integrasi mendalam dengan sistem yang ada |
Anda ingin integrasi cepat dengan model Amazon Bedrock |
Overhead operasional |
Anda dapat mengelola operasi database |
Anda AWS ingin menangani operasi |
Struktur biaya |
Anda lebih suka harga database langsung |
Anda lebih suka harga Amazon Bedrock terpadu |
Waktunya ke pasar |
Anda punya waktu untuk implementasi khusus |
Anda membutuhkan penyebaran yang cepat |