

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Ikhtisar database vektor
<a name="vector-databases"></a>

Database vektor adalah sistem khusus yang menyimpan dan menanyakan vektor dimensi tinggi secara efisien. Database ini sangat penting untuk aplikasi Retrieval Augmented Generation (RAG).

Database vektor menangani konversi dan penyimpanan data dengan cara berikut:
+ Objek (seperti audio, gambar, dan file teks) dikonversi ke vektor dengan menggunakan model embedding.
+ Vektor disimpan dalam format data khusus.
+ Database vektor memungkinkan pencarian kesamaan yang cepat.

Database vektor menawarkan beberapa keunggulan utama dibandingkan database tradisional, membuatnya sangat cocok untuk tantangan data modern. Mereka secara khusus dioptimalkan untuk operasi vektor dan menangani data dimensi tinggi secara efisien. Mereka juga mengkhususkan diri dalam pencarian kesamaan yang diperjuangkan oleh basis data tradisional. Di luar kemampuan inti ini, database vektor dibangun untuk memenuhi permintaan yang terus berkembang dari aplikasi AI dan AI generatif. Mereka unggul dalam penyimpanan vektor skala besar dan menggunakan komputasi terdistribusi untuk menyeimbangkan beban kerja di beberapa node. Ini memberikan skalabilitas dan kinerja seiring bertambahnya volume data.

Diagram berikut menunjukkan implementasi RAG:

1. Konten, seperti dokumen PDFs, atau file teks, dimasukkan ke dalam model embedding sebagai data mentah untuk diproses.

1. Model embedding mengubah data mentah menjadi vektor numerik, yang mewakili makna semantik dari konten.

1. Embeddings vektor yang dihasilkan disimpan dalam database vektor yang dioptimalkan untuk penyimpanan dan pengambilan vektor dimensi tinggi.

1. Aplikasi sekarang dapat menanyakan database vektor sebagai respons terhadap kasus penggunaan seperti pencarian semantik dan rekomendasi konten.

![Model penyematan mengubah konten menjadi embeddings vektor yang disimpan dalam database vektor untuk menanggapi kueri.](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/choosing-an-aws-vector-database-for-rag-use-cases/images/s3-model.png)


Memilih database vektor yang tidak tepat untuk solusi RAG dapat menyebabkan perjuangan dan keterbatasan yang signifikan termasuk yang berikut: 
+ Kinerja kueri yang buruk
+ Kemacetan skalabilitas
+ Tantangan konsumsi data
+ Kurangnya fitur canggih, seperti penyaringan dan peringkat
+ Kesulitan integrasi dengan sistem lain
+ Masalah ketekunan dan daya tahan
+ Masalah konkurensi dan konsistensi di lingkungan dengan banyak pengguna
+ Biaya lisensi yang lebih tinggi atau penguncian vendor
+ Dukungan dan sumber daya komunitas terbatas 
+ Potensi risiko keamanan dan kepatuhan