Praktik terbaik Vektor S3 - Amazon Simple Storage Service

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Praktik terbaik Vektor S3

Vektor Amazon S3 menghadirkan penyimpanan vektor yang dibuat khusus dan dioptimalkan biaya untuk digunakan oleh aplikasi berkemampuan AI dan pencarian semantik konten Anda yang disimpan di Amazon S3. Dirancang untuk memberikan elastisitas dan daya tahan tingkat S3 untuk menyimpan kumpulan data vektor dengan kinerja kueri sub-detik untuk kueri dingin dan serendah 100 milidetik untuk kueri hangat, Vektor S3 sangat ideal untuk aplikasi yang perlu membangun dan menumbuhkan indeks vektor. Dengan Vektor S3, Anda dapat menggunakan serangkaian operasi API khusus untuk menyimpan, mengakses, dan melakukan kueri kesamaan pada data vektor tanpa menyediakan infrastruktur apa pun. Untuk informasi selengkapnya, lihat Bekerja dengan Vektor S3 dan ember vektor.

Untuk memastikan manfaat maksimal dari Vektor S3, kami sarankan Anda melakukan praktik terbaik berikut.

Memasukkan dan menghapus vektor

Aplikasi Anda dapat mencapai hingga seribu PutVectorsatau DeleteVectorspermintaan per detik per indeks vektor, atau dapat menyisipkan atau menghapus hingga dua ribu lima ratus vektor per detik per indeks vektor — batas mana pun yang tercapai terlebih dahulu. Jika Anda melebihi tarif permintaan, Anda mungkin menerima 429 TooManyRequestsException kesalahan.

Untuk mengoptimalkan biaya, sebaiknya masukkan dan hapus vektor dalam batch besar, hingga ukuran batch maksimum 500 vektor per permintaan API. Jika beban kerja Anda membutuhkan batch yang lebih kecil, Anda dapat mengirim permintaan bersamaan hingga batas 1.000 permintaan per detik. Untuk mencapai throughput maksimum 2.500 vektor per detik, Anda dapat mengirim 5 batch per detik dengan masing-masing 500 vektor, atau 1.000 batch per detik dengan rata-rata masing-masing 2,5 vektor.

Mengakses dan menanyakan vektor dalam indeks vektor S3

Aplikasi Anda dapat mencapai ratusan QueryVectors, GetVectors, atau ListVectorspermintaan per detik per indeks vektor S3. Jika Anda melebihi tarif permintaan, Anda mungkin menerima 429 TooManyRequestsException kesalahan. Kami menyarankan Anda menggunakan mekanisme coba lagi dan konfigurasikan aplikasi Anda untuk mengirim lebih sedikit permintaan.

Penskalaan di seluruh indeks vektor

Untuk meningkatkan kinerja kueri per indeks vektor, pertimbangkan untuk mengonfigurasi aplikasi Anda untuk membagi vektor di beberapa indeks vektor bila memungkinkan. Misalnya, jika Anda memiliki beban kerja multi-tenant dan aplikasi Anda menanyakan setiap penyewa secara independen, pertimbangkan untuk menyimpan vektor setiap penyewa dalam indeks vektor terpisah. Untuk informasi selengkapnya, lihat Indeks vektor.

Menerapkan multi-tenancy dengan indeks vektor terpisah

Anda dapat mencapai multi-tenancy dengan mengatur data vektor Anda menggunakan indeks vektor tunggal untuk setiap penyewa. Anda dapat menggunakan kebijakan IAM dan bucket untuk membatasi akses setiap penyewa hanya ke indeks vektor yang ditentukan. Pendekatan ini membantu menjaga isolasi data dan menyederhanakan manajemen dengan menghilangkan kebutuhan untuk membuat bucket terpisah untuk setiap penyewa. Untuk informasi selengkapnya, lihat Manajemen Identitas dan Akses di Vektor S3.

Mengkonfigurasi bidang metadata yang tidak dapat difilter untuk indeks vektor

Saat membuat indeks vektor, konfigurasikan bidang metadata yang tidak memerlukan pemfilteran sebagai kunci metadata yang tidak dapat difilter. Misalnya, simpan potongan teks untuk penyematan vektor sebagai bidang metadata yang tidak dapat difilter saat Anda membutuhkannya hanya untuk referensi. Lihat informasi yang lebih lengkap di Metadata yang tidak dapat disaring.