Konsumsi memori Menskalakan beban kerja Anda

Memilih konfigurasi yang sesuai

Dalam pengalaman konsol, ElastiCache menawarkan cara mudah untuk memilih jenis instans yang tepat berdasarkan kebutuhan memori dan cpu dari beban kerja pencarian Anda.

Konsumsi memori

Konsumsi memori untuk bidang Vektor didasarkan pada jumlah vektor, jumlah dimensi,, dan jumlah data non-vektor M-value, seperti metadata yang terkait dengan vektor atau data lain yang disimpan dalam instance. Total memori yang dibutuhkan adalah kombinasi dari ruang yang dibutuhkan untuk data vektor aktual, dan ruang yang diperlukan untuk indeks vektor. Ruang yang diperlukan untuk data Vektor dihitung dengan mengukur kapasitas aktual yang diperlukan untuk menyimpan vektor di dalam HASH atau struktur JSON data dan overhead ke pelat memori terdekat, untuk alokasi memori yang optimal. Masing-masing indeks vektor menggunakan referensi ke data vektor yang disimpan dalam struktur data ini serta salinan tambahan vektor dalam indeks. Disarankan untuk merencanakan konsumsi ruang tambahan ini dengan indeks.

Jumlah vektor tergantung pada bagaimana Anda memutuskan untuk mewakili data Anda sebagai vektor. Misalnya, Anda dapat memilih untuk mewakili satu dokumen menjadi beberapa potongan, di mana setiap potongan mewakili vektor. Atau, Anda dapat memilih untuk mewakili seluruh dokumen sebagai vektor tunggal. Jumlah dimensi vektor Anda tergantung pada model penyematan yang Anda pilih. Misalnya, jika Anda memilih untuk menggunakan model embedding AWS Titan maka jumlah dimensi akan menjadi 1536. Perhatikan bahwa Anda harus menguji jenis instance untuk memastikannya sesuai dengan kebutuhan Anda.

Menskalakan beban kerja Anda

Pencarian mendukung ketiga metode penskalaan: horizontal, vertikal, dan replika. Saat menskalakan kapasitas, pencarian vektor berperilaku seperti Valkey biasa, yaitu, meningkatkan memori node individu (penskalaan vertikal) atau meningkatkan jumlah node (penskalaan horizontal) akan meningkatkan kapasitas keseluruhan. Dalam mode cluster, FT.CREATE perintah dapat dikirim ke node utama cluster dan sistem akan secara otomatis mendistribusikan definisi indeks baru ke semua anggota cluster.

Namun, dari perspektif kinerja, pencarian berperilaku sangat berbeda dari Valkey biasa. Implementasi pencarian multi-threaded berarti bahwa CPU tambahan menghasilkan peningkatan linier dalam throughput kueri dan konsumsi. Penskalaan horizontal menghasilkan peningkatan linier dalam throughput konsumsi tetapi dapat mengurangi throughput kueri. Jika throughput kueri tambahan diperlukan, penskalaan melalui replika atau CPU tambahan diperlukan.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Cari fitur dan batasan

Cari menulis throttling