Escolher a configuração apropriada

Na experiência do console, ElastiCache oferece uma maneira fácil de escolher o tipo de instância certo com base nos requisitos de memória e CPU da sua carga de trabalho de pesquisa.

Consumo de memória

O consumo de memória para campos vetoriais é baseado no número de vetores, no número de dimensões e na quantidade de dados não vetoriais, como metadados associados ao vetor ou outros dados armazenados na instância. M-value A memória total necessária é uma combinação do espaço necessário para os dados vetoriais reais e o espaço necessário para os índices de vetores. O espaço necessário para dados vetoriais é calculado medindo a capacidade real necessária para armazenar vetores em estruturas de dados HASH ou JSON e a sobrecarga até as placas de memória mais próximas, para alocações de memória ideais. Cada um dos índices de vetores usa referências aos dados vetoriais armazenados nessas estruturas de dados, bem como uma cópia adicional do vetor no índice. É aconselhável planejar esse consumo adicional de espaço pelo índice.

O número de vetores depende de como você decide representar os dados como vetores. Por exemplo, você pode optar por representar um único documento em vários blocos, onde cada um representa um vetor. Como alternativa, você pode optar por representar o documento inteiro como um único vetor. O número de dimensões dos vetores depende do modelo de incorporação escolhido. Por exemplo, se você optar por usar o modelo de incorporação AWS Titan, o número de dimensões seria 1536. Observe que você deve testar o tipo de instância para garantir que ela atenda aos seus requisitos.

Escalar a workload

A pesquisa suporta todos os três métodos de dimensionamento: horizontal, vertical e réplicas. Ao escalar a capacidade, a pesquisa vetorial se comporta exatamente como o Valkey normal, ou seja, aumentar a memória de nós individuais (escalabilidade vertical) ou aumentar o número de nós (escalabilidade horizontal) aumentará a capacidade geral. No modo de cluster, o comando FT.CREATE pode ser enviado para qualquer nó primário do cluster e o sistema distribuirá automaticamente a nova definição de índice para todos os membros do cluster.

No entanto, do ponto de vista do desempenho, a pesquisa se comporta de maneira muito diferente do Valkey normal. A implementação multisegmentada da pesquisa significa que CPUs adicionais geram aumentos até lineares na taxa de transferência de consulta e ingestão. A escalabilidade horizontal gera aumentos lineares no throughput de ingestão, mas pode reduzir o throughput de consultas. Se for necessário um throughput adicional de consultas, será preciso escalar por meio de réplicas ou CPUs adicionais.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Recursos e limites de pesquisa

Limitação de gravação de pesquisa