View a markdown version of this page

Perbandingan basis data vektor - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Perbandingan basis data vektor

AWS menyediakan beberapa pendekatan untuk menerapkan kemampuan pencarian vektor, mulai dari database vektor individual hingga Pangkalan Pengetahuan Amazon Bedrock, yang merupakan layanan yang dikelola sepenuhnya. Saat mengevaluasi opsi ini, organisasi harus mempertimbangkan berbagai aspek termasuk arsitektur, skalabilitas, kemampuan integrasi, karakteristik kinerja, dan fitur keamanan.

Database vektor individu

Tabel berikut memberikan ikhtisar fitur utama dari beberapa solusi database vektor AWS individu, dengan fokus pada arsitekturnya, kemampuan penskalaan, integrasi sumber data, dan karakteristik kinerja.

Fitur

Amazon Kendra

OpenSearch Layanan Amazon

Amazon RDS untuk SQLwith Postgre pgvector

Amazon DocumentDB

Amazon MemoryDB

Analisis Amazon Neptunus

Vektor Amazon S3

Kasus penggunaan primer

Pencarian perusahaan dan RAG

Pencarian dan analitik terdistribusi

Relasional DB dengan dukungan vektor

Dokumen DB dengan pencarian vektor

Pencarian vektor dalam memori waktu nyata

Analisis grafik dengan pencarian vektor

Penyimpanan vektor yang dioptimalkan biaya

Arsitektur

Dikelola sepenuhnya

Cluster terdistribusi

Basis data relasional

Berorientasi dokumen

Basis data dalam memori

Mesin analisis grafik

Penyimpanan objek tanpa server

Model Data

Berbasis dokumen

Dokumen JSON

Tabel relasional

Dokumen JSON

Nilai kunci dengan JSON

Grafik properti

Penyimpanan objek

Dimensi vektor

Dikelola secara otomatis

Hingga 16.000

Dapat dikonfigurasi

Hingga 2.000 (diindeks); 16.000 (tidak diindeks)

Hingga 32.768

Dapat dikonfigurasi

Hingga 4.096

Metode pengindeksan

Otomatis

HNSW, IVF

HNSW, IVFFlat

HNSW, IVFFlat

HNSW

Grafik dan vektor asli

Otomatis

Metrik jarak

Otomatis

Cosine, Euclidean, produk dot

Cosine, Euclidean, produk dalam

Cosine, Euclidean, produk dot

Cosine, Euclidean, produk dalam

Kosinus, Euclidean

Kosinus, Euclidean

Latensi kueri

Sub-detik

Sub-10 ms (dipercepat GPU)

10-100 ms

Milidetik

Sub-milidetik

Sub-detik

Sub-100 ms

Model penskalaan

Otomatis

Horisontal (tambahkan node)

Replika vertikal dan baca

Horizontal (tambahkan contoh)

Vertikal dan replika

Otomatis

Otomatis (tanpa server)

Vektor maksimum

Dikelola

Miliaran (tergantung cluster)

Jutaan (tergantung instans)

Jutaan per koleksi

Jutaan per database

Miliaran

2 miliar per indeks; 10.000 indeks per ember

Throughput

Tinggi

Sangat tinggi (ribuan QPS)

Sedang

Tinggi

Sangat tinggi (jutaan permintaan per hari)

Tinggi

Medium (dioptimalkan untuk kueri yang jarang)

Daya tahan data

99,999999999% (11 9 detik)

Dapat dikonfigurasi dengan replika

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99% (Multi-AZ)

99,99%

99,999999999% (11 9 detik)

Model konsistensi

Akhirnya

Akhirnya (dapat dikonfigurasi)

Kuat (ACID)

Akhirnya

Kuat

Kuat

Kuat

Kemampuan tambahan

40 atau lebih konektor data, NLP

Pencarian teks lengkap, analitik, dasbor

Kueri SQL, transaksi ACID

Kompatibilitas API MongoDB

Kompatibilitas Redis API, caching

Algoritma grafik, traversal

Integrasi Amazon S3, kebijakan siklus hidup

Model penentuan harga

Bayar per kueri dan penyimpanan

Jam dan penyimpanan instans

Jam dan penyimpanan instans

Jam dan penyimpanan instans

Jam dan penyimpanan instans

Unit kapasitas dan penyimpanan

Penyimpanan, kueri, dan transfer data

Optimalisasi biaya

Berbasis penggunaan

Contoh cadangan, auto-scaling

Contoh yang dicadangkan, Aurora Tanpa Server

Instans cadangan

Instans cadangan

Penskalaan otomatis

Penghematan hingga 90% vs khusus DBs

Terbaik untuk

Pencarian perusahaan dengan pengaturan minimal

Kueri throughput tinggi, latensi rendah

Hybrid SQL dan beban kerja vektor

Aplikasi yang kompatibel dengan MongoDB yang membutuhkan vektor

Aplikasi real-time, latensi ultra-rendah

GraphRag dan grafik pengetahuan

Penyimpanan jangka panjang dan hemat biaya

Pola kueri yang ideal

Pencarian perusahaan yang sering

Kueri real-time frekuensi tinggi

SQL campuran dan kueri vektor

Kueri dokumen dengan pencarian semantik

Jutaan permintaan per hari

Grafik traversal dengan pencarian vektor

Pertanyaan yang jarang terjadi (menit hingga jam)

Kompleksitas pengaturan

Rendah (dikelola sepenuhnya)

Sedang (konfigurasi cluster)

Sedang (pengaturan ekstensi)

Sedang (konfigurasi cluster)

Sedang (konfigurasi cluster)

Rendah (dikelola sepenuhnya)

Rendah (tanpa server)

Diperlukan keahlian tim

Minimal

OpenSearch atau Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

Database grafik

Amazon S3, konsep vektor dasar

Layanan terkelola - Basis Pengetahuan Amazon Bedrock

Amazon Bedrock Knowledge Bases menyediakan solusi yang dikelola sepenuhnya dengan beberapa opsi penyimpanan vektor. Tabel berikut membandingkan opsi penyimpanan ini.

Fitur

Aurora Postgre pgvektor SQLwith

Analisis Neptunus

OpenSearch Layanan Tanpa Server

Vektor Amazon S3

Biji pinus

RedisEnterprise Awan

Kasus penggunaan primer

Relasional DB dengan vektor RAG

Pencarian vektor berbasis grafik untuk GraphRag

Manajemen pengetahuan RAG

Vektor RAG yang dioptimalkan biaya

Pencarian vektor kinerja tinggi

Pencarian vektor dalam memori

Arsitektur

Relasional yang dikelola sepenuhnya

Analisis grafik yang dikelola sepenuhnya

Tanpa server yang dikelola sepenuhnya

Penyimpanan objek tanpa server

Cloud hybrid yang dikelola sepenuhnya

Dikelola sepenuhnya dalam memori

Model Data

Tabel relasional

Grafik properti

Dokumen JSON

Penyimpanan objek

Vektor yang dibuat khusus

Nilai kunci dengan vektor

Penyimpanan vektor

Melalui ekstensi pgvector

Vektor grafik asli

Melalui OpenSearch mesin

Penyimpanan vektor Amazon S3 asli

Database vektor asli

Vektor dalam memori

Integrasi Amazon Bedrock

Asli

Asli

Asli

Asli

Asli

Asli

Konsumsi otomatis

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Vektorisasi otomatis

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Ya (melalui Amazon Bedrock)

Penskalaan

Penskalaan otomatis (Aurora Tanpa Server)

Penskalaan grafik otomatis

Otomatis tanpa server

Otomatis (miliaran vektor)

Pod penskalaan otomatis

Cluster penskalaan otomatis

Kinerja kueri

Tinggi untuk relasional atau vektor

Tinggi untuk vektor grafik

Tinggi

Sedang (100 ms atau lebih latensi)

Sangat tinggi

Sangat tinggi

Vektor maksimum

Jutaan (tergantung instans)

Miliaran

Miliaran

2 miliar per indeks

Miliaran

Jutaan (tergantung memori)

Kemampuan tambahan

Kueri SQL, transaksi ACID

Algoritma grafik, traversal

Pencarian teks lengkap, analitik

Siklus hidup Amazon S3, tingkat

Pemfilteran metadata, ruang nama

Struktur data Redis, caching

Optimalisasi biaya

Moderat (Aurora Tanpa Server)

Sedang (unit kapasitas)

Tinggi (tanpa server,) pay-per-use

Sangat tinggi (penghematan hingga 90%)

Sedang (harga berbasis pod)

Rendah (premium dalam memori)

Terbaik untuk

Beban SQL/vector kerja hibrida

Grafik pengetahuan yang terhubung

Teks lengkap dengan pencarian vektor

Vektor jangka panjang dan jarang diakses

Pencarian vektor real-time pada skala

Kebutuhan latensi sangat rendah

Pola kueri yang ideal

SQL campuran dan kueri vektor

Grafik traversal dengan vektor

Pencarian yang sering dilakukan dengan analitik

Pengambilan yang jarang (menit hingga jam)

Kueri real-time frekuensi tinggi

Jutaan permintaan per detik

Pengaturan dengan Amazon Bedrock

Sederhana (dikelola oleh Amazon Bedrock)

Sederhana (dikelola oleh Amazon Bedrock)

Sederhana (dikelola oleh Amazon Bedrock)

Sederhana (dikelola oleh Amazon Bedrock)

Sederhana (dikelola oleh Amazon Bedrock)

Sederhana (dikelola oleh Amazon Bedrock)

Data residensi

Region AWS

Region AWS

Region AWS

Region AWS

Multi-cloud (AWS dan lainnya)

Multi-cloud (AWS dan lainnya)

Model penentuan harga

Jam dan penyimpanan instans

Unit kapasitas dan penyimpanan

Komputasi dan penyimpanan (tanpa server)

Penyimpanan, kueri, dan transfer

Jam dan penyimpanan pod

Jam dan penyimpanan node

Memilih antara opsi individu dan terkelola

Pertimbangan

Pilih vektor individu DB

Pilih Pangkalan Pengetahuan Amazon Bedrock (dikelola)

Implementasi RAG

Anda ingin kontrol penuh atas pipa RAG

Anda ingin RAG yang dikelola sepenuhnya dengan pengaturan minimal

Kustomisasi

Anda memerlukan logika pengambilan khusus dan preprocessing

Pola RAG standar memenuhi kebutuhan Anda

Infrastruktur yang ada

Anda sudah memiliki database yang digunakan

Anda mulai segar atau ingin manajemen yang disederhanakan

Keahlian tim

Tim Anda memiliki keahlian administrasi database

Anda lebih suka fokus pada logika aplikasi, bukan infrastruktur

Kompleksitas integrasi

Anda membutuhkan integrasi mendalam dengan sistem yang ada

Anda ingin integrasi cepat dengan model Amazon Bedrock

Overhead operasional

Anda dapat mengelola operasi database

Anda AWS ingin menangani operasi

Struktur biaya

Anda lebih suka harga database langsung

Anda lebih suka harga Amazon Bedrock terpadu

Waktunya ke pasar

Anda punya waktu untuk implementasi khusus

Anda membutuhkan penyebaran yang cepat