Bases de données vectorielles individuelles Service géré — Bases de connaissances Amazon Bedrock Choisir entre des options individuelles et des options gérées

Comparaison de bases de données vectorielles

AWS propose plusieurs approches pour implémenter des fonctionnalités de recherche vectorielle, allant des bases de données vectorielles individuelles aux bases de connaissances Amazon Bedrock, qui est un service entièrement géré. Lors de l'évaluation de ces options, les entreprises doivent prendre en compte divers aspects, notamment l'architecture, l'évolutivité, les capacités d'intégration, les caractéristiques de performance et les fonctionnalités de sécurité.

Bases de données vectorielles individuelles

Le tableau suivant fournit un aperçu des principales fonctionnalités de plusieurs solutions de base de données vectorielles AWS individuelles, en mettant l'accent sur leurs architectures, leurs capacités de mise à l'échelle, leurs intégrations de sources de données et leurs caractéristiques de performance.

Fonctionnalité	Amazon Kendra	Amazon OpenSearch Service	Amazon RDS pour SQLwith Postgre/pgvector	Amazon DocumentDB	Amazon MemoryDB	Amazon Neptune Analytics	Amazon S3 Vectors
Cas d'utilisation principal	Recherche d'entreprise et RAG	Recherche et analyse distribuées	Base de données relationnelle avec support vectoriel	Base de données de documents avec recherche vectorielle	Recherche vectorielle en mémoire en temps réel	Analyse graphique avec recherche vectorielle	Stockage vectoriel optimisé en termes de coûts
Architecture	Entièrement géré	Cluster distribué	Base de données relationnelle	Orienté vers les documents	Base de données en mémoire	Moteur d'analyse graphique	Stockage d'objets sans serveur
Modèle de données	Basé sur des documents	Documents JSON	Tables relationnelles	Documents JSON	Valeur-clé avec JSON	Graphe de propriétés	Stockage d'objets
Dimensions du vecteur	Géré automatiquement	Jusqu'à 16 000	Configurable	Jusqu'à 2 000 (indexé) ; 16 000 (non indexé)	Jusqu'à 32 768	Configurable	Jusqu'à 4 096
Méthodes d'indexation	Automatique	NSW, FIV	NSW, IVFFlat	NSW, IVFFlat	HNSW	Graphe et vecteur natifs	Automatique
Métriques de distance	Automatique	Cosine, Euclidean, produit à points	Cosine, produit euclidien, produit intérieur	Cosine, Euclidean, produit à points	Cosine, produit euclidien, produit intérieur	Cosinus euclidien	Cosinus euclidien
Latence des requêtes	Sous-seconde	Moins de 10 ms (accéléré par le GPU)	10 à 100 ms	Milliseconde	Moins d'une milliseconde	Sous-seconde	Moins de 100 ms
Modèle d'échelle	Automatique	Horizontal (ajouter des nœuds)	Répliques verticales et répliques en lecture	Horizontal (ajouter des instances)	Vertical et répliques	Automatique	Automatique (sans serveur)
Vecteurs maximaux	Gérées	Des milliards (en fonction du cluster)	Millions (en fonction de l'instance)	Des millions par collection	Des millions par base de données	Milliards	2 milliards par indice ; 10 000 indices par compartiment
Débit	Élevée	Très élevé (milliers de QPS)	Medium	Élevée	Très élevé (millions de demandes par jour)	Élevée	Moyen (optimisé pour les requêtes peu fréquentes)
Durabilité des données	99,999999999 % (11 9 s)	Configurable avec des répliques	99,99 % (Multi-AZ)	99,99 % (Multi-AZ)	99,99 % (Multi-AZ)	99,99 %	99,999999999 % (11 9 s)
Modèle de cohérence	Éventuel	Éventuel (configurable)	Fort (ACIDE)	Éventuel	Solide	Solide	Solide
Fonctionnalités supplémentaires	40 connecteurs de données ou plus, NLP	Recherche en texte intégral, analyses, tableaux de bord	Requêtes SQL, transactions ACID	Compatibilité avec l'API MongoDB	Compatibilité avec l'API Redis, mise en cache	Algorithmes graphiques, traversées	Intégration avec Amazon S3, politiques de cycle de vie
Modèle de tarification	Paiement par requête et par stockage	Heures d'ouverture et stockage des instances	Heures d'ouverture et stockage des instances	Heures d'ouverture et stockage des instances	Heures d'ouverture et stockage des instances	Unités de capacité et de stockage	Stockage, requêtes et transfert de données
Optimisation des coûts	Basé sur l'utilisation	Instances réservées, auto-scaling	Instances réservées, Aurora Serverless	Instances réservées	Instances réservées	Scalabilité automatique	Jusqu'à 90 % d'économies par rapport à une solution spécialisée DBs
Idéal pour	Recherche d'entreprise avec configuration minimale	Requêtes à haut débit et à faible latence	Charges de travail SQL et vectorielles hybrides	Applications compatibles avec MongoDB nécessitant des vecteurs	Applications en temps réel à très faible latence	GraphRag et graphes de connaissances	Stockage rentable et à long terme
Modèle de requête idéal	Recherches fréquentes dans les entreprises	Requêtes en temps réel à haute fréquence	Requêtes SQL et vectorielles mixtes	Requêtes de documents avec recherche sémantique	Des millions de demandes par jour	Parcours de graphes avec recherche vectorielle	Demandes peu fréquentes (de quelques minutes à quelques heures)
Complexité de configuration	Faible (entièrement géré)	Moyen (configuration en cluster)	Moyen (configuration de l'extension)	Moyen (configuration en cluster)	Moyen (configuration en cluster)	Faible (entièrement géré)	Faible (sans serveur)
Expertise d'équipe requise	Minimale	OpenSearch ou Elasticsearch	PostgreSQL, SQL	MongoDB	Redis	Bases de données graphiques	Amazon S3, concepts vectoriels de base

Service géré — Bases de connaissances Amazon Bedrock

Les bases de connaissances Amazon Bedrock fournissent une solution entièrement gérée avec plusieurs options de stockage vectoriel. Le tableau suivant compare ces options de stockage.

Fonctionnalité	Aurora Postgre pgvector SQLwith	Neptune Analytics	OpenSearch Service sans serveur	Vecteurs Amazon S3	Pomme de pin	RedisEnterprise Cloud
Cas d'utilisation principal	Base de données relationnelle avec vecteur RAG	Recherche vectorielle basée sur des graphes pour GraphRag	Gestion des connaissances RAG	RAG vectoriel optimisé en termes de coûts	Recherche vectorielle performante	Recherche vectorielle en mémoire
Architecture	Relationnel entièrement géré	Analyses graphiques entièrement gérées	Entièrement géré sans serveur	Stockage d'objets sans serveur	Cloud hybride entièrement géré	Entièrement géré en mémoire
Modèle de données	Tables relationnelles	Graphe de propriétés	Documents JSON	Stockage d'objets	Vecteurs spécialement conçus	Valeur-clé avec vecteurs
Stockage vectoriel	Grâce à l'extension pgvector	Vecteurs graphiques natifs	À travers le OpenSearch moteur	Stockage vectoriel natif d'Amazon S3	Base de données vectorielle native	Vecteurs en mémoire
Intégration avec Amazon Bedrock	Natif	Natif	Natif	Natif	Natif	Natif
Ingestion automatique	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)
Vectorisation automatique	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)	Oui (via Amazon Bedrock)
Mise à l’échelle	Mise à l'échelle automatique (Aurora Serverless)	Mise à l'échelle automatique des graphiques	Sans serveur automatique	Automatique (milliards de vecteurs)	Capsules à dimensionnement automatique	Clusters à dimensionnement automatique
Les performances des requêtes	Haut pour le mode relationnel ou vectoriel	Haut pour les vecteurs de graphes	Élevée	Moyen (latence de 100 ms ou plus)	Très élevée	Très élevée
Vecteurs maximaux	Millions (en fonction de l'instance)	Milliards	Milliards	2 milliards par indice	Milliards	Millions (en fonction de la mémoire)
Fonctionnalités supplémentaires	Requêtes SQL, transactions ACID	Algorithmes graphiques, traversées	Recherche en texte intégral, analyse	Cycle de vie d'Amazon S3, hiérarchisation	Filtrage des métadonnées, espaces de noms	Structures de données Redis, mise en cache
Optimisation des coûts	Modéré (Aurora Serverless)	Modéré (unités de capacité)	Élevé (sans serveur, pay-per-use)	Très élevé (jusqu'à 90 % d'économies)	Modéré (tarification basée sur les dosettes)	Faible (mémoire haut de gamme)
Idéal pour	Charges de SQL/vector travail hybrides	Graphes de connaissances connectés	Texte intégral avec recherche vectorielle	Vecteurs à long terme et à accès peu fréquent	Recherche vectorielle en temps réel à grande échelle	Besoins de latence très faible
Modèle de requête idéal	Requêtes SQL et vectorielles mixtes	Parcours de graphes à l'aide de vecteurs	Recherches fréquentes avec outils d'analyse	Récupération peu fréquente (de quelques minutes à quelques heures)	Requêtes en temps réel à haute fréquence	Des millions de demandes par seconde
Configuration avec Amazon Bedrock	Simple (géré par Amazon Bedrock)	Simple (géré par Amazon Bedrock)	Simple (géré par Amazon Bedrock)	Simple (géré par Amazon Bedrock)	Simple (géré par Amazon Bedrock)	Simple (géré par Amazon Bedrock)
Résidence des données	Régions AWS	Régions AWS	Régions AWS	Régions AWS	Multi-cloud (AWS et autres)	Multi-cloud (AWS et autres)
Modèle de tarification	Heures d'ouverture et stockage des instances	Unités de capacité et de stockage	Calcul et stockage (sans serveur)	Stockage, requêtes et transfert	Heures d'ouverture et stockage du pod	Heures d'ouverture et stockage des nœuds

Choisir entre des options individuelles et des options gérées

Considération	Choisissez une base de données vectorielle individuelle	Choisissez les bases de connaissances Amazon Bedrock (gérées)
Implémentation du RAG	Vous voulez un contrôle total sur le pipeline RAG	Vous voulez un RAG entièrement géré avec une configuration minimale
Personnalisation	Vous avez besoin d'une logique de récupération et d'un prétraitement personnalisés	Les modèles RAG standard répondent à vos besoins
Infrastructures existantes	La base de données est déjà déployée	Vous reprenez un nouveau départ ou souhaitez une gestion simplifiée
Expertise de l'équipe	Votre équipe possède une expertise en administration de bases de données	Vous préférez vous concentrer sur la logique des applications plutôt que sur l'infrastructure
Complexité d'intégration	Vous avez besoin d'une intégration approfondie avec les systèmes existants	Vous souhaitez une intégration rapide avec les modèles Amazon Bedrock
Frais généraux d'exploitation	Vous pouvez gérer les opérations de base de données	Vous souhaitez AWS gérer les opérations
Structure des coûts	Vous préférez la tarification directe des bases de données	Vous préférez une tarification Amazon Bedrock unifiée
Délai de mise sur le marché	Vous avez le temps de procéder à une mise en œuvre personnalisée	Vous avez besoin d'un déploiement rapide

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Options de base de données vectorielles

Comparaisons de coûts et considérations