Konsumsi vektor - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konsumsi vektor

Konsumsi vektor membantu Anda dengan cepat menelan dan mengindeks OpenSearch domain dan koleksi Tanpa Server. OpenSearch Layanan memeriksa domain atau koleksi Anda dan membuat saluran konsumsi atas nama Anda untuk memuat data Anda. OpenSearch Konsumsi dan pengindeksan domain atau koleksi Anda dikelola untuk Anda oleh konsumsi Vector.

Anda dapat mempercepat dan mengoptimalkan proses pengindeksan dengan mengaktifkan GPU-percepatan untuk pengindeksan vektor dan Optimalkan otomatis fitur. Dengan konsumsi Vector, Anda tidak perlu mengelola infrastruktur, perangkat lunak tambalan, atau cluster skala yang mendasarinya untuk mendukung pengindeksan dan konsumsi basis data vektor Anda. Ini memungkinkan Anda untuk dengan cepat membangun database vektor Anda untuk memenuhi kebutuhan Anda.

Cara kerjanya

Konsumsi vektor memeriksa domain atau koleksi Anda dan indeksnya. Anda dapat mengonfigurasi bidang indeks vektor secara manual atau mengizinkan OpenSearch untuk menggunakan konfigurasi otomatis.

Vector ingestion menggunakan OpenSearch Ingestion (OSI) sebagai pipeline data antara Amazon S3 dan. OpenSearch Layanan memproses vektor secara paralel untuk mengoptimalkan kecepatan konsumsi sambil menghormati batas penskalaan OSI dan. OpenSearch

OpenSearch Harga konsumsi vektor

Pada waktu tertentu, Anda hanya membayar jumlah konsumsi vektor OCUs yang dialokasikan ke pipa, terlepas dari apakah ada data yang mengalir melalui pipa. OpenSearch konsumsi vektor segera mengakomodasi beban kerja Anda dengan menskalakan kapasitas pipa ke atas atau ke bawah berdasarkan penggunaan.

Untuk detail harga selengkapnya, lihat Harga OpenSearch Layanan Amazon.

Prasyarat

Sebelum menggunakan konsumsi vektor, pastikan Anda memiliki sumber daya berikut:

  • Bucket Amazon S3 yang berisi dokumen OpenSearch JSON Anda dalam format parket

  • OpenSearch sumber daya - baik domain atau koleksi

  • OpenSearch versi 2.19 atau yang lebih baru (diperlukan untuk integrasi optimasi otomatis)

Buat database vektor

Gunakan alur kerja pembuatan pekerjaan konsumsi vektor untuk menyiapkan penyetelan indeks vektor otomatis dan mempercepat pembuatan indeks skala besar.

catatan

Konten prosedural di bagian ini dapat berubah saat antarmuka pengguna diselesaikan. Alur kerja dapat diperbarui di rilis mendatang untuk mencerminkan pengalaman konsol terbaru.

Untuk membuat pekerjaan injeksi vektor
  1. Di bagian Detail pekerjaan konsumsi vektor, untuk Nama, masukkan nama untuk pekerjaan konsumsi Anda.

  2. Di bagian Sumber data, konfigurasikan yang berikut ini:

    1. Untuk URI Amazon S3, masukkan lokasi bucket Amazon S3 yang berisi dokumen Service JSON OpenSearch Anda.

    2. Pilih Jelajahi Amazon S3 untuk memilih dari bucket yang tersedia, atau pilih Lihat untuk melihat pratinjau konten bucket.

    3. Untuk jenis Konten, pilih salah satu dari berikut ini:

      • Vektor - Dokumen sudah berisi vektor dan tidak memerlukan pembuatan penyematan vektor lebih lanjut.

      • Teks, gambar, atau audio - Dokumen berisi konten seperti teks, gambar atau byte audio yang perlu dikodekan ke dalam embeddings vektor.

  3. Di bagian Izin sumber data, konfigurasikan izin akses:

    1. Untuk peran IAM, pilih salah satu dari berikut ini:

      • Buat peran baru

      • Gunakan peran yang ada

    2. Untuk nama peran IAM, masukkan nama untuk peran tersebut.

  4. Di bagian Tujuan, konfigurasikan titik akhir OpenSearch Layanan:

    1. Untuk Endpoint, pilih Pilih opsi untuk memilih dari domain atau koleksi yang kompatibel di wilayah saat ini.

    2. Pilih Berikutnya untuk melanjutkan dengan titik akhir yang dipilih.

  5. Pilih Berikutnya untuk melanjutkan ke langkah berikutnya, atau pilih Batalkan untuk keluar tanpa menyimpan.

Penyerapan vektor berfungsi dengan fitur OpenSearch Layanan Amazon berikut untuk mengoptimalkan kinerja basis data vektor Anda:

GPU-percepatan untuk pengindeksan vektor

Akselerasi GPU mengurangi waktu yang dibutuhkan untuk membuat, memperbarui, dan menghapus indeks vektor. Ketika digunakan dengan konsumsi vektor, Anda dapat secara signifikan mempercepat proses konsumsi dan pengindeksan untuk database vektor skala besar.

Optimalkan otomatis

Optimalkan otomatis secara otomatis menemukan trade-off optimal antara latensi pencarian, kualitas, dan persyaratan memori. Konsumsi vektor dapat menerapkan rekomendasi optimasi otomatis selama proses konsumsi untuk memastikan indeks vektor Anda dikonfigurasi secara optimal.

Untuk hasil terbaik, pertimbangkan untuk mengaktifkan akselerasi GPU dan Optimalkan Otomatis saat menggunakan konsumsi vektor untuk membangun basis data vektor skala besar.