Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Choix de la configuration appropriée
Dans le cadre de l'expérience console ElastiCache , vous pouvez facilement choisir le type d'instance approprié en fonction des exigences en matière de mémoire et de processeur de votre charge de travail vectorielle.
Consommation de mémoire
La consommation de mémoire est basée sur le nombre de vecteurs, le nombre de dimensions, la valeur M et la quantité de données non vectorielles, telles que les métadonnées associées au vecteur ou d'autres données stockées dans l'instance. La mémoire totale requise est une combinaison de l'espace nécessaire pour les données vectorielles réelles et de l'espace requis pour les indices vectoriels. L'espace requis pour les données vectorielles est calculé en mesurant la capacité réelle requise pour stocker des vecteurs au sein HASH de structures de JSON données et le surdébit par rapport aux dalles de mémoire les plus proches, pour des allocations de mémoire optimales. Chacun des index vectoriels utilise des références aux données vectorielles stockées dans ces structures de données ainsi qu'une copie supplémentaire du vecteur dans l'index. Il est conseillé de prévoir cette consommation d'espace supplémentaire par l'indice.
Le nombre de vecteurs dépend de la façon dont vous décidez de représenter vos données sous forme de vecteurs. Par exemple, vous pouvez choisir de représenter un seul document en plusieurs parties, chaque partie représentant un vecteur. Vous pouvez également choisir de représenter l'ensemble du document sous la forme d'un vecteur unique. Le nombre de dimensions de vos vecteurs dépend du modèle d'intégration que vous choisissez. Par exemple, si vous choisissez d'utiliser le modèle d'intégration AWS Titan, le nombre de dimensions sera de 1536. Notez que vous devez tester le type d'instance pour vous assurer qu'il répond à vos besoins.
Élargir votre charge de travail
La recherche vectorielle prend en charge les trois méthodes de mise à l'échelle : horizontale, verticale et répliques. Lors de la mise à l'échelle de la capacité, la recherche vectorielle se comporte comme un Valkey classique, c'est-à-dire que l'augmentation de la mémoire des nœuds individuels (mise à l'échelle verticale) ou l'augmentation du nombre de nœuds (mise à l'échelle horizontale) augmentera la capacité globale. En mode cluster, la FT.CREATE commande peut être envoyée à n'importe quel nœud principal du cluster et le système distribuera automatiquement la nouvelle définition d'index à tous les membres du cluster.
Cependant, du point de vue des performances, la recherche vectorielle se comporte très différemment de Valkey classique. La mise en œuvre multithread de la recherche vectorielle signifie un CPUs rendement supplémentaire pouvant aller jusqu'à une augmentation linéaire du débit de requête et d'ingestion. La mise à l'échelle horizontale entraîne des augmentations linéaires du débit d'ingestion, mais peut réduire le débit des requêtes. Si un débit de requêtes supplémentaire est requis, un dimensionnement par le biais de répliques ou d'un débit supplémentaire CPUs est requis.