Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memilih konfigurasi yang sesuai
Dalam pengalaman konsol, ElastiCache menawarkan cara mudah untuk memilih jenis instans yang tepat berdasarkan kebutuhan memori dan cpu dari beban kerja vektor Anda.
Konsumsi memori
Konsumsi memori didasarkan pada jumlah vektor, jumlah dimensi, nilai-M, dan jumlah data non-vektor, seperti metadata yang terkait dengan vektor atau data lain yang disimpan dalam instance. Total memori yang dibutuhkan adalah kombinasi dari ruang yang dibutuhkan untuk data vektor aktual, dan ruang yang diperlukan untuk indeks vektor. Ruang yang diperlukan untuk data Vektor dihitung dengan mengukur kapasitas aktual yang diperlukan untuk menyimpan vektor di dalam HASH atau struktur JSON data dan overhead ke pelat memori terdekat, untuk alokasi memori yang optimal. Masing-masing indeks vektor menggunakan referensi ke data vektor yang disimpan dalam struktur data ini serta salinan tambahan vektor dalam indeks. Disarankan untuk merencanakan konsumsi ruang tambahan ini dengan indeks.
Jumlah vektor tergantung pada bagaimana Anda memutuskan untuk mewakili data Anda sebagai vektor. Misalnya, Anda dapat memilih untuk mewakili satu dokumen menjadi beberapa potongan, di mana setiap potongan mewakili vektor. Atau, Anda dapat memilih untuk mewakili seluruh dokumen sebagai vektor tunggal. Jumlah dimensi vektor Anda tergantung pada model penyematan yang Anda pilih. Misalnya, jika Anda memilih untuk menggunakan model embedding AWS Titan maka jumlah dimensi akan menjadi 1536. Perhatikan bahwa Anda harus menguji jenis instance untuk memastikannya sesuai dengan kebutuhan Anda.
Menskalakan beban kerja Anda
Pencarian vektor mendukung ketiga metode penskalaan: horizontal, vertikal, dan replika. Saat menskalakan kapasitas, pencarian vektor berperilaku seperti Valkey biasa, yaitu, meningkatkan memori node individu (penskalaan vertikal) atau meningkatkan jumlah node (penskalaan horizontal) akan meningkatkan kapasitas keseluruhan. Dalam mode cluster, FT.CREATE perintah dapat dikirim ke node utama cluster dan sistem akan secara otomatis mendistribusikan definisi indeks baru ke semua anggota cluster.
Namun, dari perspektif kinerja, pencarian vektor berperilaku sangat berbeda dari Valkey biasa. Implementasi multi-threaded dari pencarian vektor berarti bahwa CPUs hasil tambahan hingga peningkatan linier dalam throughput kueri dan konsumsi. Penskalaan horizontal menghasilkan peningkatan linier dalam throughput konsumsi tetapi dapat mengurangi throughput kueri. Jika throughput kueri tambahan diperlukan, penskalaan melalui replika atau tambahan CPUs diperlukan.