View a markdown version of this page

Comparaison de bases de données vectorielles - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comparaison de bases de données vectorielles

AWS propose plusieurs approches pour implémenter des fonctionnalités de recherche vectorielle, allant des bases de données vectorielles individuelles aux bases de connaissances Amazon Bedrock, qui est un service entièrement géré. Lors de l'évaluation de ces options, les entreprises doivent prendre en compte divers aspects, notamment l'architecture, l'évolutivité, les capacités d'intégration, les caractéristiques de performance et les fonctionnalités de sécurité.

Bases de données vectorielles individuelles

Le tableau suivant fournit un aperçu des principales fonctionnalités de plusieurs solutions de base de données vectorielles AWS individuelles, en mettant l'accent sur leurs architectures, leurs capacités de mise à l'échelle, leurs intégrations de sources de données et leurs caractéristiques de performance.

Fonctionnalité

Amazon Kendra

Amazon OpenSearch Service

Amazon RDS pour SQLwith Postgre/pgvector

Amazon DocumentDB

Amazon MemoryDB

Amazon Neptune Analytics

Amazon S3 Vectors

Cas d'utilisation principal

Recherche d'entreprise et RAG

Recherche et analyse distribuées

Base de données relationnelle avec support vectoriel

Base de données de documents avec recherche vectorielle

Recherche vectorielle en mémoire en temps réel

Analyse graphique avec recherche vectorielle

Stockage vectoriel optimisé en termes de coûts

Architecture

Entièrement géré

Cluster distribué

Base de données relationnelle

Orienté vers les documents

Base de données en mémoire

Moteur d'analyse graphique

Stockage d'objets sans serveur

Modèle de données

Basé sur des documents

Documents JSON

Tables relationnelles

Documents JSON

Valeur-clé avec JSON

Graphe de propriétés

Stockage d'objets

Dimensions du vecteur

Géré automatiquement

Jusqu'à 16 000

Configurable

Jusqu'à 2 000 (indexé) ; 16 000 (non indexé)

Jusqu'à 32 768

Configurable

Jusqu'à 4 096

Méthodes d'indexation

Automatique

NSW, FIV

NSW, IVFFlat

NSW, IVFFlat

HNSW

Graphe et vecteur natifs

Automatique

Métriques de distance

Automatique

Cosine, Euclidean, produit à points

Cosine, produit euclidien, produit intérieur

Cosine, Euclidean, produit à points

Cosine, produit euclidien, produit intérieur

Cosinus euclidien

Cosinus euclidien

Latence des requêtes

Sous-seconde

Moins de 10 ms (accéléré par le GPU)

10 à 100 ms

Milliseconde

Moins d'une milliseconde

Sous-seconde

Moins de 100 ms

Modèle d'échelle

Automatique

Horizontal (ajouter des nœuds)

Répliques verticales et répliques en lecture

Horizontal (ajouter des instances)

Vertical et répliques

Automatique

Automatique (sans serveur)

Vecteurs maximaux

Gérées

Des milliards (en fonction du cluster)

Millions (en fonction de l'instance)

Des millions par collection

Des millions par base de données

Milliards

2 milliards par indice ; 10 000 indices par compartiment

Débit

Élevée

Très élevé (milliers de QPS)

Medium

Élevée

Très élevé (millions de demandes par jour)

Élevée

Moyen (optimisé pour les requêtes peu fréquentes)

Durabilité des données

99,999999999 % (11 9 s)

Configurable avec des répliques

99,99 % (Multi-AZ)

99,99 % (Multi-AZ)

99,99 % (Multi-AZ)

99,99 %

99,999999999 % (11 9 s)

Modèle de cohérence

Éventuel

Éventuel (configurable)

Fort (ACIDE)

Éventuel

Solide

Solide

Solide

Fonctionnalités supplémentaires

40 connecteurs de données ou plus, NLP

Recherche en texte intégral, analyses, tableaux de bord

Requêtes SQL, transactions ACID

Compatibilité avec l'API MongoDB

Compatibilité avec l'API Redis, mise en cache

Algorithmes graphiques, traversées

Intégration avec Amazon S3, politiques de cycle de vie

Modèle de tarification

Paiement par requête et par stockage

Heures d'ouverture et stockage des instances

Heures d'ouverture et stockage des instances

Heures d'ouverture et stockage des instances

Heures d'ouverture et stockage des instances

Unités de capacité et de stockage

Stockage, requêtes et transfert de données

Optimisation des coûts

Basé sur l'utilisation

Instances réservées, auto-scaling

Instances réservées, Aurora Serverless

Instances réservées

Instances réservées

Scalabilité automatique

Jusqu'à 90 % d'économies par rapport à une solution spécialisée DBs

Idéal pour

Recherche d'entreprise avec configuration minimale

Requêtes à haut débit et à faible latence

Charges de travail SQL et vectorielles hybrides

Applications compatibles avec MongoDB nécessitant des vecteurs

Applications en temps réel à très faible latence

GraphRag et graphes de connaissances

Stockage rentable et à long terme

Modèle de requête idéal

Recherches fréquentes dans les entreprises

Requêtes en temps réel à haute fréquence

Requêtes SQL et vectorielles mixtes

Requêtes de documents avec recherche sémantique

Des millions de demandes par jour

Parcours de graphes avec recherche vectorielle

Demandes peu fréquentes (de quelques minutes à quelques heures)

Complexité de configuration

Faible (entièrement géré)

Moyen (configuration en cluster)

Moyen (configuration de l'extension)

Moyen (configuration en cluster)

Moyen (configuration en cluster)

Faible (entièrement géré)

Faible (sans serveur)

Expertise d'équipe requise

Minimale

OpenSearch ou Elasticsearch

PostgreSQL, SQL

MongoDB

Redis

Bases de données graphiques

Amazon S3, concepts vectoriels de base

Service géré — Bases de connaissances Amazon Bedrock

Les bases de connaissances Amazon Bedrock fournissent une solution entièrement gérée avec plusieurs options de stockage vectoriel. Le tableau suivant compare ces options de stockage.

Fonctionnalité

Aurora Postgre pgvector SQLwith

Neptune Analytics

OpenSearch Service sans serveur

Vecteurs Amazon S3

Pomme de pin

RedisEnterprise Cloud

Cas d'utilisation principal

Base de données relationnelle avec vecteur RAG

Recherche vectorielle basée sur des graphes pour GraphRag

Gestion des connaissances RAG

RAG vectoriel optimisé en termes de coûts

Recherche vectorielle performante

Recherche vectorielle en mémoire

Architecture

Relationnel entièrement géré

Analyses graphiques entièrement gérées

Entièrement géré sans serveur

Stockage d'objets sans serveur

Cloud hybride entièrement géré

Entièrement géré en mémoire

Modèle de données

Tables relationnelles

Graphe de propriétés

Documents JSON

Stockage d'objets

Vecteurs spécialement conçus

Valeur-clé avec vecteurs

Stockage vectoriel

Grâce à l'extension pgvector

Vecteurs graphiques natifs

À travers le OpenSearch moteur

Stockage vectoriel natif d'Amazon S3

Base de données vectorielle native

Vecteurs en mémoire

Intégration avec Amazon Bedrock

Natif

Natif

Natif

Natif

Natif

Natif

Ingestion automatique

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Vectorisation automatique

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Oui (via Amazon Bedrock)

Mise à l’échelle

Mise à l'échelle automatique (Aurora Serverless)

Mise à l'échelle automatique des graphiques

Sans serveur automatique

Automatique (milliards de vecteurs)

Capsules à dimensionnement automatique

Clusters à dimensionnement automatique

Les performances des requêtes

Haut pour le mode relationnel ou vectoriel

Haut pour les vecteurs de graphes

Élevée

Moyen (latence de 100 ms ou plus)

Très élevée

Très élevée

Vecteurs maximaux

Millions (en fonction de l'instance)

Milliards

Milliards

2 milliards par indice

Milliards

Millions (en fonction de la mémoire)

Fonctionnalités supplémentaires

Requêtes SQL, transactions ACID

Algorithmes graphiques, traversées

Recherche en texte intégral, analyse

Cycle de vie d'Amazon S3, hiérarchisation

Filtrage des métadonnées, espaces de noms

Structures de données Redis, mise en cache

Optimisation des coûts

Modéré (Aurora Serverless)

Modéré (unités de capacité)

Élevé (sans serveur, pay-per-use)

Très élevé (jusqu'à 90 % d'économies)

Modéré (tarification basée sur les dosettes)

Faible (mémoire haut de gamme)

Idéal pour

Charges de SQL/vector travail hybrides

Graphes de connaissances connectés

Texte intégral avec recherche vectorielle

Vecteurs à long terme et à accès peu fréquent

Recherche vectorielle en temps réel à grande échelle

Besoins de latence très faible

Modèle de requête idéal

Requêtes SQL et vectorielles mixtes

Parcours de graphes à l'aide de vecteurs

Recherches fréquentes avec outils d'analyse

Récupération peu fréquente (de quelques minutes à quelques heures)

Requêtes en temps réel à haute fréquence

Des millions de demandes par seconde

Configuration avec Amazon Bedrock

Simple (géré par Amazon Bedrock)

Simple (géré par Amazon Bedrock)

Simple (géré par Amazon Bedrock)

Simple (géré par Amazon Bedrock)

Simple (géré par Amazon Bedrock)

Simple (géré par Amazon Bedrock)

Résidence des données

Régions AWS

Régions AWS

Régions AWS

Régions AWS

Multi-cloud (AWS et autres)

Multi-cloud (AWS et autres)

Modèle de tarification

Heures d'ouverture et stockage des instances

Unités de capacité et de stockage

Calcul et stockage (sans serveur)

Stockage, requêtes et transfert

Heures d'ouverture et stockage du pod

Heures d'ouverture et stockage des nœuds

Choisir entre des options individuelles et des options gérées

Considération

Choisissez une base de données vectorielle individuelle

Choisissez les bases de connaissances Amazon Bedrock (gérées)

Implémentation du RAG

Vous voulez un contrôle total sur le pipeline RAG

Vous voulez un RAG entièrement géré avec une configuration minimale

Personnalisation

Vous avez besoin d'une logique de récupération et d'un prétraitement personnalisés

Les modèles RAG standard répondent à vos besoins

Infrastructures existantes

La base de données est déjà déployée

Vous reprenez un nouveau départ ou souhaitez une gestion simplifiée

Expertise de l'équipe

Votre équipe possède une expertise en administration de bases de données

Vous préférez vous concentrer sur la logique des applications plutôt que sur l'infrastructure

Complexité d'intégration

Vous avez besoin d'une intégration approfondie avec les systèmes existants

Vous souhaitez une intégration rapide avec les modèles Amazon Bedrock

Frais généraux d'exploitation

Vous pouvez gérer les opérations de base de données

Vous souhaitez AWS gérer les opérations

Structure des coûts

Vous préférez la tarification directe des bases de données

Vous préférez une tarification Amazon Bedrock unifiée

Délai de mise sur le marché

Vous avez le temps de procéder à une mise en œuvre personnalisée

Vous avez besoin d'un déploiement rapide