Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Comparaison de bases de données vectorielles
AWS propose plusieurs approches pour implémenter des fonctionnalités de recherche vectorielle, allant des bases de données vectorielles individuelles aux bases de connaissances Amazon Bedrock, qui est un service entièrement géré. Lors de l'évaluation de ces options, les entreprises doivent prendre en compte divers aspects, notamment l'architecture, l'évolutivité, les capacités d'intégration, les caractéristiques de performance et les fonctionnalités de sécurité.
Bases de données vectorielles individuelles
Le tableau suivant fournit un aperçu des principales fonctionnalités de plusieurs solutions de base de données vectorielles AWS individuelles, en mettant l'accent sur leurs architectures, leurs capacités de mise à l'échelle, leurs intégrations de sources de données et leurs caractéristiques de performance.
Fonctionnalité |
Amazon Kendra |
Amazon OpenSearch Service |
Amazon RDS pour SQLwith Postgre/pgvector |
Amazon DocumentDB |
Amazon MemoryDB |
Amazon Neptune Analytics |
Amazon S3 Vectors |
|---|---|---|---|---|---|---|---|
Cas d'utilisation principal |
Recherche d'entreprise et RAG |
Recherche et analyse distribuées |
Base de données relationnelle avec support vectoriel |
Base de données de documents avec recherche vectorielle |
Recherche vectorielle en mémoire en temps réel |
Analyse graphique avec recherche vectorielle |
Stockage vectoriel optimisé en termes de coûts |
Architecture |
Entièrement géré |
Cluster distribué |
Base de données relationnelle |
Orienté vers les documents |
Base de données en mémoire |
Moteur d'analyse graphique |
Stockage d'objets sans serveur |
Modèle de données |
Basé sur des documents |
Documents JSON |
Tables relationnelles |
Documents JSON |
Valeur-clé avec JSON |
Graphe de propriétés |
Stockage d'objets |
Dimensions du vecteur |
Géré automatiquement |
Jusqu'à 16 000 |
Configurable |
Jusqu'à 2 000 (indexé) ; 16 000 (non indexé) |
Jusqu'à 32 768 |
Configurable |
Jusqu'à 4 096 |
Méthodes d'indexation |
Automatique |
NSW, FIV |
NSW, IVFFlat |
NSW, IVFFlat |
HNSW |
Graphe et vecteur natifs |
Automatique |
Métriques de distance |
Automatique |
Cosine, Euclidean, produit à points |
Cosine, produit euclidien, produit intérieur |
Cosine, Euclidean, produit à points |
Cosine, produit euclidien, produit intérieur |
Cosinus euclidien |
Cosinus euclidien |
Latence des requêtes |
Sous-seconde |
Moins de 10 ms (accéléré par le GPU) |
10 à 100 ms |
Milliseconde |
Moins d'une milliseconde |
Sous-seconde |
Moins de 100 ms |
Modèle d'échelle |
Automatique |
Horizontal (ajouter des nœuds) |
Répliques verticales et répliques en lecture |
Horizontal (ajouter des instances) |
Vertical et répliques |
Automatique |
Automatique (sans serveur) |
Vecteurs maximaux |
Gérées |
Des milliards (en fonction du cluster) |
Millions (en fonction de l'instance) |
Des millions par collection |
Des millions par base de données |
Milliards |
2 milliards par indice ; 10 000 indices par compartiment |
Débit |
Élevée |
Très élevé (milliers de QPS) |
Medium |
Élevée |
Très élevé (millions de demandes par jour) |
Élevée |
Moyen (optimisé pour les requêtes peu fréquentes) |
Durabilité des données |
99,999999999 % (11 9 s) |
Configurable avec des répliques |
99,99 % (Multi-AZ) |
99,99 % (Multi-AZ) |
99,99 % (Multi-AZ) |
99,99 % |
99,999999999 % (11 9 s) |
Modèle de cohérence |
Éventuel |
Éventuel (configurable) |
Fort (ACIDE) |
Éventuel |
Solide |
Solide |
Solide |
Fonctionnalités supplémentaires |
40 connecteurs de données ou plus, NLP |
Recherche en texte intégral, analyses, tableaux de bord |
Requêtes SQL, transactions ACID |
Compatibilité avec l'API MongoDB |
Compatibilité avec l'API Redis, mise en cache |
Algorithmes graphiques, traversées |
Intégration avec Amazon S3, politiques de cycle de vie |
Modèle de tarification |
Paiement par requête et par stockage |
Heures d'ouverture et stockage des instances |
Heures d'ouverture et stockage des instances |
Heures d'ouverture et stockage des instances |
Heures d'ouverture et stockage des instances |
Unités de capacité et de stockage |
Stockage, requêtes et transfert de données |
Optimisation des coûts |
Basé sur l'utilisation |
Instances réservées, auto-scaling |
Instances réservées, Aurora Serverless |
Instances réservées |
Instances réservées |
Scalabilité automatique |
Jusqu'à 90 % d'économies par rapport à une solution spécialisée DBs |
Idéal pour |
Recherche d'entreprise avec configuration minimale |
Requêtes à haut débit et à faible latence |
Charges de travail SQL et vectorielles hybrides |
Applications compatibles avec MongoDB nécessitant des vecteurs |
Applications en temps réel à très faible latence |
GraphRag et graphes de connaissances |
Stockage rentable et à long terme |
Modèle de requête idéal |
Recherches fréquentes dans les entreprises |
Requêtes en temps réel à haute fréquence |
Requêtes SQL et vectorielles mixtes |
Requêtes de documents avec recherche sémantique |
Des millions de demandes par jour |
Parcours de graphes avec recherche vectorielle |
Demandes peu fréquentes (de quelques minutes à quelques heures) |
Complexité de configuration |
Faible (entièrement géré) |
Moyen (configuration en cluster) |
Moyen (configuration de l'extension) |
Moyen (configuration en cluster) |
Moyen (configuration en cluster) |
Faible (entièrement géré) |
Faible (sans serveur) |
Expertise d'équipe requise |
Minimale |
OpenSearch ou Elasticsearch |
PostgreSQL, SQL |
MongoDB |
Redis |
Bases de données graphiques |
Amazon S3, concepts vectoriels de base |
Service géré — Bases de connaissances Amazon Bedrock
Les bases de connaissances Amazon Bedrock fournissent une solution entièrement gérée avec plusieurs options de stockage vectoriel. Le tableau suivant compare ces options de stockage.
Fonctionnalité |
Aurora Postgre pgvector SQLwith |
Neptune Analytics |
OpenSearch Service sans serveur |
Vecteurs Amazon S3 |
Pomme de pin |
RedisEnterprise Cloud |
|---|---|---|---|---|---|---|
Cas d'utilisation principal |
Base de données relationnelle avec vecteur RAG |
Recherche vectorielle basée sur des graphes pour GraphRag |
Gestion des connaissances RAG |
RAG vectoriel optimisé en termes de coûts |
Recherche vectorielle performante |
Recherche vectorielle en mémoire |
Architecture |
Relationnel entièrement géré |
Analyses graphiques entièrement gérées |
Entièrement géré sans serveur |
Stockage d'objets sans serveur |
Cloud hybride entièrement géré |
Entièrement géré en mémoire |
Modèle de données |
Tables relationnelles |
Graphe de propriétés |
Documents JSON |
Stockage d'objets |
Vecteurs spécialement conçus |
Valeur-clé avec vecteurs |
Stockage vectoriel |
Grâce à l'extension pgvector |
Vecteurs graphiques natifs |
À travers le OpenSearch moteur |
Stockage vectoriel natif d'Amazon S3 |
Base de données vectorielle native |
Vecteurs en mémoire |
Intégration avec Amazon Bedrock |
Natif |
Natif |
Natif |
Natif |
Natif |
Natif |
Ingestion automatique |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Vectorisation automatique |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Oui (via Amazon Bedrock) |
Mise à l’échelle |
Mise à l'échelle automatique (Aurora Serverless) |
Mise à l'échelle automatique des graphiques |
Sans serveur automatique |
Automatique (milliards de vecteurs) |
Capsules à dimensionnement automatique |
Clusters à dimensionnement automatique |
Les performances des requêtes |
Haut pour le mode relationnel ou vectoriel |
Haut pour les vecteurs de graphes |
Élevée |
Moyen (latence de 100 ms ou plus) |
Très élevée |
Très élevée |
Vecteurs maximaux |
Millions (en fonction de l'instance) |
Milliards |
Milliards |
2 milliards par indice |
Milliards |
Millions (en fonction de la mémoire) |
Fonctionnalités supplémentaires |
Requêtes SQL, transactions ACID |
Algorithmes graphiques, traversées |
Recherche en texte intégral, analyse |
Cycle de vie d'Amazon S3, hiérarchisation |
Filtrage des métadonnées, espaces de noms |
Structures de données Redis, mise en cache |
Optimisation des coûts |
Modéré (Aurora Serverless) |
Modéré (unités de capacité) |
Élevé (sans serveur, pay-per-use) |
Très élevé (jusqu'à 90 % d'économies) |
Modéré (tarification basée sur les dosettes) |
Faible (mémoire haut de gamme) |
Idéal pour |
Charges de SQL/vector travail hybrides |
Graphes de connaissances connectés |
Texte intégral avec recherche vectorielle |
Vecteurs à long terme et à accès peu fréquent |
Recherche vectorielle en temps réel à grande échelle |
Besoins de latence très faible |
Modèle de requête idéal |
Requêtes SQL et vectorielles mixtes |
Parcours de graphes à l'aide de vecteurs |
Recherches fréquentes avec outils d'analyse |
Récupération peu fréquente (de quelques minutes à quelques heures) |
Requêtes en temps réel à haute fréquence |
Des millions de demandes par seconde |
Configuration avec Amazon Bedrock |
Simple (géré par Amazon Bedrock) |
Simple (géré par Amazon Bedrock) |
Simple (géré par Amazon Bedrock) |
Simple (géré par Amazon Bedrock) |
Simple (géré par Amazon Bedrock) |
Simple (géré par Amazon Bedrock) |
Résidence des données |
Régions AWS |
Régions AWS |
Régions AWS |
Régions AWS |
Multi-cloud (AWS et autres) |
Multi-cloud (AWS et autres) |
Modèle de tarification |
Heures d'ouverture et stockage des instances |
Unités de capacité et de stockage |
Calcul et stockage (sans serveur) |
Stockage, requêtes et transfert |
Heures d'ouverture et stockage du pod |
Heures d'ouverture et stockage des nœuds |
Choisir entre des options individuelles et des options gérées
Considération |
Choisissez une base de données vectorielle individuelle |
Choisissez les bases de connaissances Amazon Bedrock (gérées) |
|---|---|---|
Implémentation du RAG |
Vous voulez un contrôle total sur le pipeline RAG |
Vous voulez un RAG entièrement géré avec une configuration minimale |
Personnalisation |
Vous avez besoin d'une logique de récupération et d'un prétraitement personnalisés |
Les modèles RAG standard répondent à vos besoins |
Infrastructures existantes |
La base de données est déjà déployée |
Vous reprenez un nouveau départ ou souhaitez une gestion simplifiée |
Expertise de l'équipe |
Votre équipe possède une expertise en administration de bases de données |
Vous préférez vous concentrer sur la logique des applications plutôt que sur l'infrastructure |
Complexité d'intégration |
Vous avez besoin d'une intégration approfondie avec les systèmes existants |
Vous souhaitez une intégration rapide avec les modèles Amazon Bedrock |
Frais généraux d'exploitation |
Vous pouvez gérer les opérations de base de données |
Vous souhaitez AWS gérer les opérations |
Structure des coûts |
Vous préférez la tarification directe des bases de données |
Vous préférez une tarification Amazon Bedrock unifiée |
Délai de mise sur le marché |
Vous avez le temps de procéder à une mise en œuvre personnalisée |
Vous avez besoin d'un déploiement rapide |