Pencarian vektor - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pencarian vektor

Pencarian vektor di Amazon OpenSearch Service memungkinkan Anda mencari konten semantik yang serupa menggunakan penyematan pembelajaran mesin daripada pencocokan kata kunci tradisional. Pencarian vektor mengubah data Anda (teks, gambar, audio, dll.) Menjadi vektor numerik dimensi tinggi (embeddings) yang menangkap makna semantik konten. Saat Anda melakukan pencarian, OpenSearch bandingkan representasi vektor kueri Anda dengan vektor yang disimpan untuk menemukan item yang paling mirip.

Pencarian vektor mencakup komponen-komponen kunci berikut.

Bidang vektor

OpenSearch mendukung jenis knn_vector bidang untuk menyimpan vektor padat dengan dimensi yang dapat dikonfigurasi (hingga 16.000).

Metode pencarian
  • K-nn (k-tetangga terdekat): Menemukan k vektor yang paling mirip

  • Perkiraan K-nn: Menggunakan algoritma seperti HNSW (Hierarchical Navigable Small World) untuk pencarian lebih cepat pada kumpulan data besar

Metrik jarak

Mendukung berbagai perhitungan kesamaan termasuk:

  • Jarak Euclidean

  • Kesamaan kosinus

  • Produk dot

Kasus penggunaan umum

Pencarian vektor mendukung kasus penggunaan umum berikut.

  • Pencarian semantik: Temukan dokumen dengan arti yang sama, bukan hanya kata kunci yang cocok

  • Sistem rekomendasi: Sarankan produk, konten, atau pengguna serupa

  • Pencarian gambar: Temukan gambar yang mirip secara visual

  • Deteksi anomali: Identifikasi outlier dalam pola data

  • RAG (Retrieval Augmented Generation): Tingkatkan respons LLM dengan konteks yang relevan

Integrasi dengan pembelajaran mesin

OpenSearch terintegrasi dengan layanan dan model pembelajaran mesin berikut:

  • Amazon Bedrock: Untuk menghasilkan embeddings menggunakan model foundation

  • Amazon SageMaker AI: Untuk penerapan model HTML khusus

  • Model Hugging Face: Model penyematan pra-terlatih

  • Model khusus: Model penyematan terlatih Anda sendiri

Dengan pencarian vektor, Anda dapat membangun aplikasi canggih yang didukung AI yang memahami konteks dan makna, jauh melampaui kemampuan pencocokan teks tradisional.