Consommation de mémoire Élargir votre charge de travail

Choix de la configuration appropriée

Dans le cadre de l'expérience console ElastiCache , vous pouvez facilement choisir le type d'instance approprié en fonction des exigences en matière de mémoire et de processeur de votre charge de travail de recherche.

Consommation de mémoire

La consommation de mémoire pour les champs vectoriels est basée sur le nombre de vecteurs, le nombre de dimensions M-value, la quantité de données non vectorielles, telles que les métadonnées associées au vecteur ou d'autres données stockées dans l'instance. La mémoire totale requise est une combinaison de l'espace nécessaire pour les données vectorielles réelles et de l'espace requis pour les indices vectoriels. L'espace requis pour les données vectorielles est calculé en mesurant la capacité réelle requise pour stocker des vecteurs au sein HASH de structures de JSON données et le surdébit par rapport aux dalles de mémoire les plus proches, pour des allocations de mémoire optimales. Chacun des index vectoriels utilise des références aux données vectorielles stockées dans ces structures de données ainsi qu'une copie supplémentaire du vecteur dans l'index. Il est conseillé de prévoir cette consommation d'espace supplémentaire par l'indice.

Le nombre de vecteurs dépend de la façon dont vous décidez de représenter vos données sous forme de vecteurs. Par exemple, vous pouvez choisir de représenter un seul document en plusieurs parties, chaque partie représentant un vecteur. Vous pouvez également choisir de représenter l'ensemble du document sous la forme d'un vecteur unique. Le nombre de dimensions de vos vecteurs dépend du modèle d'intégration que vous choisissez. Par exemple, si vous choisissez d'utiliser le modèle d'intégration AWS Titan, le nombre de dimensions sera de 1536. Notez que vous devez tester le type d'instance pour vous assurer qu'il répond à vos besoins.

Élargir votre charge de travail

La recherche prend en charge les trois méthodes de mise à l'échelle : horizontale, verticale et répliques. Lors de la mise à l'échelle de la capacité, la recherche vectorielle se comporte comme un Valkey classique, c'est-à-dire que l'augmentation de la mémoire des nœuds individuels (mise à l'échelle verticale) ou l'augmentation du nombre de nœuds (mise à l'échelle horizontale) augmentera la capacité globale. En mode cluster, la FT.CREATE commande peut être envoyée à n'importe quel nœud principal du cluster et le système distribuera automatiquement la nouvelle définition d'index à tous les membres du cluster.

Cependant, du point de vue des performances, la recherche se comporte très différemment de Valkey classique. La mise en œuvre multithread de la recherche signifie que des processeurs supplémentaires entraînent des augmentations linéaires du débit de requête et d'ingestion. La mise à l'échelle horizontale entraîne des augmentations linéaires du débit d'ingestion, mais peut réduire le débit des requêtes. Si un débit de requêtes supplémentaire est requis, une mise à l'échelle via des répliques ou des processeurs supplémentaires est requise.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Fonctionnalités et limites de recherche

Régulation de la recherche et de l'écriture