Options de base de données vectorielles individuelles Option de service géré Choisir la bonne base de données vectorielle

Options de base de données vectorielles

AWS propose une gamme variée de solutions de bases de données vectorielles pour répondre à différents cas d'utilisation et exigences dans les applications d'IA générative. Ces options peuvent être classées globalement en services de base de données individuels et en offres de services gérés, chacune présentant des caractéristiques et des avantages distincts. Comprendre ces options est essentiel pour les entreprises qui cherchent à mettre en œuvre efficacement des fonctionnalités de recherche vectorielle tout en maintenant des performances, une évolutivité et une rentabilité optimales.

Pour plus d'informations sur les solutions de base de données vectorielles, consultez les sections suivantes :

Options de base de données vectorielles individuelles
Option de service géré
Choisir la bonne base de données vectorielle

Options de base de données vectorielles individuelles

Les options de base de données vectorielles individuelles disponibles AWS incluent Amazon Kendra, Amazon OpenSearch Service, Amazon RDS for PostgreSQL avec pgvector, Amazon MemoryDB, Amazon DocumentDB, Amazon DocumentDB, AmazonNeptune Analytics et Amazon S3 Vector. (Extension open source, pgvector ajoute la possibilité de stocker et de rechercher des intégrations vectorielles générées par ML.) Ces solutions proposent différentes approches de la recherche vectorielle, permettant aux entreprises de choisir en fonction de leur infrastructure existante, de leurs exigences techniques et de leurs cas d'utilisation spécifiques.

Amazon Kendra

Amazon Kendra est un service de recherche intelligent destiné aux entreprises qui utilise le traitement du langage naturel et des algorithmes d'apprentissage automatique avancés pour renvoyer des réponses spécifiques aux questions de recherche à partir de vos données. Amazon Kendra simplifie la mise en œuvre de la fonctionnalité de recherche, ce qui en fait une solution backend efficace pour les applications d'IA générative.

Les autres fonctionnalités clés d'Amazon Kendra sont les suivantes :

Connexions natives à plus de 40 sources de données
Fonctionnalités intégrées de préparation des données
Configuration rapide ne nécessitant pas d'expertise technique approfondie

Les avantages d'Amazon Kendra sont les suivants :

Traitement automatisé des données (découpage, ingestion, extraction)
De puissantes options de personnalisation :
Accès programmatique simple via le AWS SDK pour Python (Boto3)

Pour plus d'informations, consultez la section Avantages d'Amazon Kendra dans la documentation Amazon Kendra.

Amazon OpenSearch Service

Amazon OpenSearch Service est un service géré qui vous aide à déployer, exploiter et dimensionner des clusters OpenSearch de services dans le AWS Cloud.

Les principales fonctionnalités du OpenSearch Service sont les suivantes :

Moteur de recherche et d'analyse open source
Architecture distribuée
Traitement des données en temps réel

Certains avantages de l'utilisation du OpenSearch Service sont les suivants :

Scalabilité horizontale
RESTful Support de l'API
Gère les données structurées et non structurées
Analyse des données en temps réel
Adapté à différentes tailles de déploiement

Pour plus d'informations, consultez la section Fonctionnalités d'Amazon OpenSearch Service dans la documentation du OpenSearch service.

Amazon RDS pour PostgreSQL avec pgvector

Amazon RDS for PostgreSQL avec pgvector AWS associe le service de base de données relationnelle gérée à l'extension de traitement vectoriel de PostgreSQL. Cette combinaison permet aux entreprises de stocker et d'interroger des vecteurs de grande dimension tout en gérant Amazon RDS. La solution est particulièrement adaptée aux applications d'intelligence artificielle génératives qui nécessitent des opérations vectorielles en temps réel sans la surcharge liée à la gestion de l'infrastructure de base de données.

Les principaux avantages d'Amazon RDS pour PostgreSQL avec pgvector sont les suivants :

Haute disponibilité
Basculement automatique
Rentable (pay-per-use)
Surveillance intégrée
Intégration de données vectorielles en temps réel

Pour plus d'informations, consultez les avantages d'Amazon RDS dans la documentation Amazon RDS.

Amazon DocumentDB

Amazon DocumentDB (compatible avec MongoDB) est une base de données de documents qui offre des fonctionnalités de recherche vectorielle natives dans les versions 5.0 et ultérieures. Il combine la flexibilité du stockage de documents basé sur JSON avec la recherche vectorielle, prenant en charge à la fois les méthodes d'indexation hiérarchiques navigables Small World (HNSW) et Inverted File Flat (). IVFFlat

Les principales fonctionnalités d'Amazon DocumentDB sont les suivantes :

Stockez et indexez des vecteurs jusqu'à 2 000 dimensions (jusqu'à 16 000 dimensions sans indexation)
Temps de réponse en millisecondes pour les recherches de similarité vectorielle
Support pour les mesures de distance entre produits euclidiens, cosinus et points
Intégration parfaite avec les applications compatibles MongoDB existantes

Utilisez Amazon DocumentDB dans les situations suivantes :

Pour les applications qui utilisent déjà MongoDB APIs et qui ont besoin de fonctionnalités de recherche vectorielle
Pour les cas d'utilisation nécessitant des structures de données documentaires flexibles associées à une recherche sémantique
Pour les scénarios nécessitant à la fois des requêtes documentaires traditionnelles et des recherches de similarité vectorielle
Pour les applications proposant des recommandations de produits, des personnalisations, des assistants de chat et des services de détection des fraudes

Pour plus d'informations, consultez la section Recherche vectorielle pour Amazon DocumentDB dans la documentation Amazon DocumentDB.

Amazon MemoryDB

Amazon MemoryDB est une base de données en mémoire compatible Redis qui fournit les performances de recherche vectorielle les plus rapides parmi les bases de données vectorielles les plus populaires sur. AWS Il fournit des latences de requête inférieures à la milliseconde avec une durabilité dans les zones de multidisponibilité.

Les principales fonctionnalités de MemoryDB sont les suivantes :

Stockez les données des applications et des millions de vecteurs dans une seule base de données
Temps de réponse aux requêtes et aux mises à jour à un chiffre en millisecondes
Les taux de rappel les plus élevés pour les performances les plus rapides sur AWS
Support pour un maximum de 32 768 dimensions par vecteur
Fonctionnalités de recherche sémantique et de mise en cache en temps réel

Utilisez MemoryDB dans les situations suivantes :

Pour les applications en temps réel qui nécessitent une latence très faible (inférieure à 10 ms)
Pour les charges de travail à haut débit avec des millions de demandes par jour
Pour les cas d'utilisation tels que les moteurs de recommandation en temps réel, la mise en cache sémantique et la détection d'anomalies
Pour les applications nécessitant à la fois un stockage de données en mémoire et des fonctionnalités de recherche vectorielle

Pour plus d'informations, consultez la section Recherche vectorielle dans la documentation de MemoryDB.

Amazon Neptune Analytics

Amazon Neptune Analytics est un moteur d'analyse graphique qui offre des fonctionnalités de recherche vectorielle natives, ce qui le rend idéal pour les cas d'utilisation de Graph Retrieval Augmented Generation (GraphRag). Il combine la recherche de similarité vectorielle avec des traversées de graphes et des algorithmes.

Les principales fonctionnalités de Neptune Analytics sont les suivantes :

Analysez des dizaines de milliards de relations en quelques secondes
Combinez la recherche vectorielle avec des algorithmes graphiques (recherche de trajectoire, détection de communauté, centralité)
Support pour les applications GraphRag avec des connaissances topologiques
Jusqu'à 80 fois plus rapide que les solutions d'analyse graphique existantes
Intégration à Amazon Bedrock pour une gestion complète de GraphRag

Utilisez Neptune Analytics dans les situations suivantes :

Pour les applications GraphRag qui nécessitent des graphes de connaissances avec intégrations vectorielles
Pour les cas d'utilisation qui nécessitent de parcourir des relations complexes parallèlement à la similarité vectorielle
Pour les applications qui nécessitent des réponses explicables de l'IA avec un contexte relationnel
Pour des scénarios tels que les vues à 360 degrés des clients, les réseaux de détection des fraudes et la découverte de connaissances

Pour plus d'informations, consultez la documentation Amazon Neptune Analytics.

Amazon S3 Vectors

Amazon S3 Vectors est le premier magasin d'objets cloud doté AWS de capacités natives de stockage vectoriel et de requêtes. Il fournit un stockage vectoriel spécialement conçu et optimisé en termes de coûts pour les applications d'IA nécessitant une grande échelle.

Les principales fonctionnalités d'Amazon S3 Vectors sont les suivantes :

Stockage pour jusqu'à 2 milliards de vecteurs par index avec prise en charge de jusqu'à 10 000 index par compartiment de vecteurs
Latence de requête inférieure à 100 ms optimisée pour le stockage à long terme et les modèles d'accès peu fréquents
Jusqu'à 90 % de réduction des coûts pour les opérations vectorielles par rapport aux bases de données vectorielles spécialisées
Architecture sans serveur avec mise à l'échelle automatique et durabilité de 99,999999999 % (11 s)

Utilisez les vecteurs Amazon S3 dans les situations suivantes :

Pour les applications qui nécessitent le stockage de milliards de vecteurs à un coût minimal
Pour les charges de travail qui tolèrent une latence de requête inférieure à une seconde (100 ms ou plus) au lieu de 10 ms
Pour la conservation des vecteurs à long terme et les cas d'utilisation de l'archivage
Pour les applications RAG avec des modèles de récupération peu fréquents
Pour les entreprises qui privilégient l'économie du stockage par rapport à une latence extrêmement faible

Amazon S3 Vectors s'intègre nativement aux bases de connaissances Amazon Bedrock et fonctionne bien dans les architectures à plusieurs niveaux avec Amazon Service. OpenSearch Vous pouvez utiliser les vecteurs Amazon S3 pour le stockage à froid et utiliser le OpenSearch service pour les requêtes chaudes.

Pour plus d'informations, consultez la section Utilisation des vecteurs S3 et des compartiments vectoriels dans la documentation Amazon S3.

Option de service géré

Amazon Bedrock Knowledge Bases représente l'approche AWS entièrement gérée de la mise en œuvre de bases de données vectorielles. La flexibilité des options de stockage du service, combinée à ses fonctionnalités de gestion automatisée, le rend particulièrement utile pour les entreprises qui cherchent à mettre en œuvre le RAG sans gérer une infrastructure complexe.

Avec les bases de connaissances Amazon Bedrock, vous pouvez créer, gérer et consulter des bases de connaissances qui améliorent vos modèles de base à l'aide de RAG. Ce service simplifie le processus complexe de mise en œuvre de RAG en gérant l'intégralité du pipeline d'ingestion, de vectorisation et de récupération des données.

Les principaux avantages des bases de connaissances Amazon Bedrock sont les suivants :

Traitement des données simplifié
- Ingestion et segmentation automatiques des données
- Extraction de texte intégrée à partir de plusieurs formats de fichiers
- Génération d'intégrations vectorielles gérées
- Extraction et indexation automatiques des métadonnées
Implémentation rationalisée du RAG
- Stratégies de récupération préconfigurées
- Optimisation automatique des fenêtres contextuelles
- Réglage de la pertinence intégré
- Fonctionnalités de recherche sémantique prêtes à l'emploi
Sécurité et gouvernance
- Contrôles intégrés Gestion des identités et des accès AWS (IAM)
- Chiffrement des données au repos et en transit
- Prise en charge de VPC
- Journalisation des audits avec AWS CloudTrail

Les bases de connaissances Amazon Bedrock prennent en charge plusieurs options de boutiques vectorielles, notamment :

Amazon Aurora PostgreSQL avec pgvector
Amazon Neptune Analytics
Amazon EMR sans serveur
Amazon S3 Vectors
Pinecone
Redis Enterprise Cloud

Ce service géré gère l'ingestion, la vectorisation et la récupération automatisées des données. Cela simplifie les implémentations de RAG.

Pour obtenir des informations détaillées sur chaque boutique vectorielle prise en charge, consultez la documentation des bases de connaissances Amazon Bedrock.

Choisir la bonne base de données vectorielle

Sélectionnez votre base de données vectorielle en fonction de ces facteurs de décision clés :

Si vous avez besoin d'une base de données de documents compatible avec MongoDB avec recherche vectorielle, choisissez Amazon DocumentDB. C'est idéal lorsque votre application utilise MongoDB APIs et que vous souhaitez ajouter des fonctionnalités de recherche sémantique sans gérer une infrastructure vectorielle distincte.
Si vous avez besoin d'une latence très faible pour les applications en temps réel, choisissez Amazon MemoryDB. Cela permet d'obtenir les performances de recherche vectorielle les plus rapides AWS avec des temps de réponse inférieurs à la milliseconde. Il est idéal pour les moteurs de recommandation en temps réel et les applications à haut débit.
Si vous avez besoin de représentations de connaissances basées sur des graphes avec recherche vectorielle, choisissez Amazon Neptune Analytics. C'est la solution idéale pour les applications GraphRag qui doivent traverser des relations complexes et effectuer des requêtes basées sur des graphes parallèlement à des recherches vectorielles, fournissant ainsi des réponses explicables par l'IA.
Si vous devez associer des requêtes relationnelles à une recherche vectorielle, choisissez Amazon Aurora PostgreSQL avec pgvector. Cette option est idéale lorsque votre application nécessite à la fois des opérations SQL traditionnelles et des recherches de similarité vectorielle au sein de la même base de données.
Si vous avez besoin de requêtes à haut débit avec une latence inférieure à 10 ms, choisissez Amazon Service. OpenSearch Il excelle dans la gestion des requêtes à haute fréquence et des applications en temps réel et inclut de récentes améliorations de l'accélération du GPU.
Si vous devez stocker des milliards de vecteurs de manière rentable, optez pour Amazon S3 Vectors. Cette option permet de réaliser jusqu'à 90 % d'économies et est idéale pour les applications dont les modèles de récupération sont peu fréquents (de quelques minutes à quelques heures entre les requêtes) et qui peuvent tolérer une latence inférieure à 100 ms.
Si vous avez besoin d'une recherche en texte intégral associée à une recherche vectorielle, choisissez Amazon OpenSearch Service. Cette option combine de puissantes fonctionnalités de recherche en texte intégral et de recherche vectorielle sur une seule plateforme.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Vue d'ensemble des bases de données vectorielles

Comparaison de bases de données vectorielles