Escolher a configuração apropriada - Amazon ElastiCache

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Escolher a configuração apropriada

Na experiência do console, ElastiCache oferece uma maneira fácil de escolher o tipo de instância certo com base nos requisitos de memória e CPU da sua carga de trabalho vetorial.

Consumo de memória

O consumo de memória é baseado no número de vetores, no número de dimensões, no valor M e na quantidade de dados não vetoriais, como metadados associados ao vetor ou outros dados armazenados na instância. A memória total necessária é uma combinação do espaço necessário para os dados vetoriais reais e o espaço necessário para os índices de vetores. O espaço necessário para dados vetoriais é calculado medindo a capacidade real necessária para armazenar vetores em estruturas de dados HASH ou JSON e a sobrecarga até as placas de memória mais próximas, para alocações de memória ideais. Cada um dos índices de vetores usa referências aos dados vetoriais armazenados nessas estruturas de dados, bem como uma cópia adicional do vetor no índice. É aconselhável planejar esse consumo adicional de espaço pelo índice.

O número de vetores depende de como você decide representar os dados como vetores. Por exemplo, você pode optar por representar um único documento em vários blocos, onde cada um representa um vetor. Como alternativa, você pode optar por representar o documento inteiro como um único vetor. O número de dimensões dos vetores depende do modelo de incorporação escolhido. Por exemplo, se você optar por usar o modelo de incorporação AWS Titan, o número de dimensões seria 1536. Observe que você deve testar o tipo de instância para garantir que ela atenda aos seus requisitos.

Escalar a workload

A pesquisa vetorial é compatível com todos os três métodos de dimensionamento: horizontal, vertical e réplicas. Ao escalar a capacidade, a pesquisa vetorial se comporta exatamente como o Valkey normal, ou seja, aumentar a memória de nós individuais (escalabilidade vertical) ou aumentar o número de nós (escalabilidade horizontal) aumentará a capacidade geral. No modo de cluster, o comando FT.CREATE pode ser enviado para qualquer nó primário do cluster e o sistema distribuirá automaticamente a nova definição de índice para todos os membros do cluster.

No entanto, do ponto de vista do desempenho, a pesquisa vetorial se comporta de maneira muito diferente do Valkey normal. A implementação multisegmentada da pesquisa vetorial significa um CPUs rendimento adicional de até aumentos lineares na taxa de transferência de consulta e ingestão. A escalabilidade horizontal gera aumentos lineares no throughput de ingestão, mas pode reduzir o throughput de consultas. Se for necessária uma taxa de transferência adicional de consultas, é necessário escalar por meio de réplicas ou mais CPUs .