Indices vectoriels - Amazon Simple Storage Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Indices vectoriels

Note

Amazon S3 Vectors est en version préliminaire pour Amazon Simple Storage Service et est sujet à modification.

Note

Choisissez soigneusement les paramètres de configuration de votre index vectoriel. Après avoir créé un index vectoriel, vous ne pouvez pas mettre à jour le nom de l'index vectoriel, la dimension, la métrique de distance ou les clés de métadonnées non filtrables. Pour modifier l'une de ces valeurs, vous devez créer un nouvel index vectoriel.

Les index vectoriels sont des ressources contenues dans des compartiments vectoriels qui stockent et organisent les données vectorielles pour des opérations de recherche de similarité efficaces. Lorsque vous créez un index vectoriel, vous spécifiez la métrique de distance (CosineouEuclidean), le nombre de dimensions qu'un vecteur doit avoir et, éventuellement, une liste de champs de métadonnées que vous souhaitez exclure du filtrage lors des requêtes de similarité.

Pour plus d'informations sur les limites d'index vectoriel par compartiment, les limites vectorielles par index et les limites de dimension par vecteur, consultezLimites et restrictions.

Chaque index vectoriel possède un Amazon Resource Name (ARN) unique. Les ARNs index vectoriels suivent le format suivant :

arn:aws:s3vectors:region:account-id:bucket/bucket-name/index/index-name

Exigences relatives à la dénomination des index vectoriels

  • Les noms des index vectoriels doivent être uniques dans le compartiment vectoriel.

  • Les noms des index vectoriels doivent comporter entre 3 et 63 caractères.

  • Les caractères valides sont les lettres minuscules (a-z), les chiffres (0-9), les traits d'union (-) et les points (.).

  • Les noms des index vectoriels doivent commencer et se terminer par une lettre ou un chiffre.

Exigences relatives aux dimensions

Une dimension est le nombre de valeurs d'un vecteur. Tous les vecteurs ajoutés à l'index doivent avoir exactement ce nombre de valeurs.

  • Une dimension doit être un entier compris entre 1 et 4096.

  • Une plus grande dimension nécessite plus d'espace de stockage.

Options de mesure de distance

La métrique de distance indique le mode de calcul de la similarité entre les vecteurs. Lorsque vous créez des intégrations vectorielles, choisissez la métrique de distance recommandée pour votre modèle d'intégration pour des résultats plus précis.

  • Cosinus — Mesure le cosinus de l'angle entre les vecteurs. Idéal pour les vecteurs normalisés et lorsque la direction compte plus que la magnitude.

  • Euclidean — Mesure la distance en ligne droite entre les vecteurs. Il est préférable de le faire lorsque la direction et l'amplitude sont importantes.

Clés de métadonnées non filtrables

Les clés de métadonnées vous permettent d'associer des informations supplémentaires à vos vecteurs sous forme de paires clé-valeur lors du stockage et de la récupération. Par défaut, toutes les métadonnées sont filtrables. Vous pouvez donc les utiliser pour filtrer les résultats des requêtes. Toutefois, vous pouvez désigner des clés de métadonnées spécifiques comme non filtrables lorsque vous souhaitez stocker des informations à l'aide de vecteurs sans les utiliser pour le filtrage.

Contrairement aux clés de métadonnées par défaut, ces clés ne peuvent pas être utilisées comme filtres de requête. Les clés de métadonnées non filtrables peuvent être récupérées mais ne peuvent pas être recherchées, interrogées ou filtrées. Vous ne pouvez y accéder qu'après avoir trouvé l'index.

Les clés de métadonnées non filtrables vous permettent d'enrichir les vecteurs avec du contexte supplémentaire que vous souhaitez récupérer avec les résultats de recherche sans avoir besoin de filtrer. Un exemple courant de clé de métadonnées non filtrable est lorsque vous incorporez du texte dans des vecteurs et que vous souhaitez inclure le texte original lui-même en tant que métadonnées non filtrables. Cela vous permet de renvoyer le texte source à côté des résultats de recherche vectorielle sans augmenter les limites de taille des métadonnées filtrables. D'autres exemples incluent le stockage des horodatages de création, de la source URLs ou des informations descriptives à des fins de référence uniquement. Les clés de métadonnées non filtrables sont accessibles lors de la récupération de vecteurs mais, contrairement aux clés de métadonnées par défaut, elles ne peuvent pas être utilisées comme filtres de requête.

Les exigences relatives aux clés de métadonnées non filtrables sont les suivantes.

  • Les clés de métadonnées non filtrables doivent être uniques dans l'index vectoriel.

  • Les clés de métadonnées non filtrables doivent comporter entre 1 et 63 caractères.

  • Les clés de métadonnées non filtrables ne peuvent pas être modifiées une fois l'index vectoriel créé.

  • Les vecteurs S3 prennent en charge jusqu'à 10 clés de métadonnées non filtrables par index.