Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables à l'utilisation d'un magasin vectoriel que vous avez créé pour une base de connaissances
Pour stocker les intégrations vectorielles vers lesquelles vos documents sont convertis, vous utilisez un magasin vectoriel. Les bases de connaissances Amazon Bedrock proposent un flux de création rapide pour certaines boutiques vectorielles. Par conséquent, si vous préférez qu'Amazon Bedrock crée automatiquement un index vectoriel pour vous dans l'une de ces boutiques vectorielles, ignorez cette condition préalable et passez à. Créez une base de connaissances en vous connectant à une source de données dans les bases de connaissances Amazon Bedrock
Si vous souhaitez stocker des intégrations vectorielles binaires au lieu des intégrations vectorielles à virgule flottante standard (float32), vous devez utiliser un magasin de vecteurs prenant en charge les vecteurs binaires.
Note
Les clusters Amazon OpenSearch Serverless et Amazon OpenSearch Managed sont les seuls magasins de vecteurs qui prennent en charge le stockage de vecteurs binaires.
Vous pouvez configurer votre propre magasin de vecteurs pris en charge pour indexer la représentation vectorielle incorporée de vos données. Vous créez des champs pour les données suivantes :
-
Champ pour les vecteurs générés à partir du texte de votre source de données par le modèle d'intégration que vous avez choisi.
-
Champ pour les fragments de texte extraits des fichiers de votre source de données.
-
Champs pour les métadonnées des fichiers source gérés par Amazon Bedrock.
-
(Si vous utilisez une base de données Amazon Aurora et que vous souhaitez configurer le filtrage des métadonnées) Champs pour les métadonnées que vous associez à vos fichiers source. Si vous envisagez de configurer le filtrage dans d'autres magasins de vecteurs, il n'est pas nécessaire de configurer ces champs pour le filtrage.
Vous pouvez chiffrer des magasins de vecteurs tiers à l'aide d'une clé KMS. Pour plus d'informations, consultez la section Chiffrement des ressources de la base de connaissances.
Sélectionnez l'onglet correspondant au service de magasin vectoriel que vous utiliserez pour créer votre index vectoriel.
Note
Votre choix de modèle d'intégration et de dimensions vectorielles peut affecter les choix de magasins de vecteurs disponibles. Si vous n'êtes pas en mesure d'utiliser votre magasin de vecteurs préféré, choisissez les options compatibles : le modèle d'intégration et les dimensions vectorielles.
- Amazon OpenSearch Serverless
-
-
Pour configurer les autorisations et créer une collection de recherche vectorielle dans Amazon OpenSearch Serverless dans le AWS Management Console, suivez les étapes 1 et 2 de la section Utilisation des collections de recherche vectorielle dans le manuel Amazon OpenSearch Service Developer Guide. Tenez compte des considérations suivantes lors de la configuration de votre collection :
-
Donnez à la collection un nom et une description de votre choix.
-
Pour rendre votre collection privée, sélectionnez Création standard dans la section Sécurité. Ensuite, dans la section Paramètres d'accès au réseau, sélectionnez VPC comme type d'accès et choisissez un point de terminaison VPC. Pour plus d'informations sur la configuration d'un point de terminaison VPC pour une collection Amazon Serverless, consultez Access Amazon OpenSearch OpenSearch Serverless à l'aide d'un point de terminaison d'interface ()AWS PrivateLink dans le manuel Amazon OpenSearch Service Developer Guide.
-
-
Une fois la collection créée, prenez note de l'ARN de la collection lorsque vous créez la base de connaissances.
-
Dans le volet de navigation de gauche, sélectionnez Collections sous Serverless. Sélectionnez ensuite votre collection de recherche vectorielle.
-
Sélectionnez l'onglet Indexes. Choisissez ensuite Créer un index vectoriel.
-
Dans la section Détails de l'index vectoriel, entrez le nom de votre index dans le champ Nom de l'index vectoriel.
-
Dans la section Champs vectoriels, choisissez Ajouter un champ vectoriel. Amazon Bedrock stocke les intégrations vectorielles de votre source de données dans ce champ. Fournissez les configurations suivantes :
-
Nom du champ vectoriel — Donnez un nom au champ (par exemple,
embeddings
). -
Moteur — Le moteur vectoriel utilisé pour la recherche. Sélectionnez Faiss.
-
Dimensions : nombre de dimensions du vecteur. Reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir :
Modèle Dimensions TitanIntégrations G1 - Texte 1 536 TitanEmbeddings V2 - Texte 1 024, 512 et 256 CohereEmbedAnglais 1,024 CohereEmbedMultilingue 1,024 -
Métrique de distance : métrique utilisée pour mesurer la similarité entre les vecteurs. Nous recommandons d'utiliser Euclidean pour les intégrations vectorielles à virgule flottante.
-
-
Développez la section Gestion des métadonnées et ajoutez deux champs pour configurer l'index vectoriel afin de stocker des métadonnées supplémentaires qu'une base de connaissances peut récupérer à l'aide de vecteurs. Le tableau suivant décrit les champs et les valeurs à spécifier pour chaque champ :
Description du champ Champ de mappage Type de données Filtrable Amazon Bedrock découpe le texte brut de vos données et stocke les fragments dans ce champ. Nom de votre choix (par exemple, text
)Chaîne True Amazon Bedrock stocke les métadonnées relatives à votre base de connaissances dans ce domaine. Nom de votre choix (par exemple, bedrock-metadata
)Chaîne False -
Prenez note des noms que vous choisissez pour le nom de l'index vectoriel, le nom du champ vectoriel et les noms des champs de mappage de gestion des métadonnées lorsque vous créez votre base de connaissances. Ensuite, choisissez Créer.
Une fois l'index vectoriel créé, vous pouvez créer votre base de connaissances. Le tableau suivant indique où vous allez entrer chaque information dont vous avez pris note.
Champ Champ correspondant dans la configuration de la base de connaissances (console) Champ correspondant dans la configuration de la base de connaissances (API) Description ARN de collecte ARN de collecte Collection Arn Le nom de ressource Amazon (ARN) de la collection de recherche vectorielle. Nom de l'index vectoriel Nom de l'index vectoriel vectorIndexName Nom de l'index vectoriel. Nom du champ vectoriel Champ vectoriel Champ vectoriel Nom du champ dans lequel vous souhaitez stocker les intégrations vectorielles pour vos sources de données. Gestion des métadonnées (premier champ de mappage) Champ de texte Champ de texte Nom du champ dans lequel vous souhaitez stocker le texte brut issu de vos sources de données. Gestion des métadonnées (deuxième champ de mappage) Champ de métadonnées géré par Bedrock Champ de métadonnées Nom du champ dans lequel stocker les métadonnées gérées par Amazon Bedrock. Pour une documentation plus détaillée sur la configuration d'un magasin vectoriel dans Amazon OpenSearch Serverless, consultez la section Utilisation des collections de recherche vectorielle dans le manuel Amazon OpenSearch Service Developer Guide.
-
- Amazon OpenSearch Service Managed Clusters
-
Important
-
Avant d'utiliser des ressources de domaine dans des clusters OpenSearch gérés, vous devez configurer certaines autorisations et politiques d'accès IAM. Pour de plus amples informations, veuillez consulter Conditions préalables et autorisations requises pour utiliser les clusters OpenSearch gérés avec les bases de connaissances Amazon Bedrock.
-
Si vous rencontrez des problèmes d'ingestion de données, cela peut indiquer une capacité OpenSearch de domaine insuffisante. Pour résoudre ce problème, augmentez la capacité de votre domaine en fournissant des IOPS plus élevées et en augmentant les paramètres de débit. Pour plus d'informations, consultez Bonnes pratiques opérationnelles pour Amazon OpenSearch Service.
-
Pour créer un domaine et un index vectoriel dans OpenSearch Cluster in the AWS Management Console, suivez les étapes décrites dans la section Création et gestion de domaines de OpenSearch service dans le manuel Amazon OpenSearch Service Developer Guide.
Tenez compte des considérations suivantes lors de la configuration de votre domaine :
-
Donnez au domaine le nom de votre choix.
-
Nous vous recommandons d'utiliser l'option de création facile pour commencer rapidement à créer votre domaine.
Note
Cette option vous permet d'obtenir un domaine à faible débit. Si vous avez des charges de travail plus importantes qui nécessitent un débit plus élevé, choisissez l'option de création standard. Vous pouvez ajuster la capacité ultérieurement selon vos besoins. Avec cette option, vous pouvez commencer avec la capacité la plus faible, qui peut ensuite être modifiée ultérieurement selon les besoins.
-
Pour Réseau, vous devez choisir Accès public. OpenSearch les domaines situés derrière un VPC ne sont pas pris en charge par votre base de connaissances.
-
Pour la version, si vous utilisez des intégrations vectorielles binaires, les bases de connaissances Amazon Bedrock nécessitent une version 2.16 ou ultérieure du moteur. En outre, une version 2.13 ou supérieure est requise pour créer un index k-nn. Pour plus d'informations, consultez K-NN Search dans le guide du développeur Amazon OpenSearch Service.
-
Nous vous recommandons d'utiliser le mode Dual-Stack.
-
Nous vous recommandons d'activer le contrôle d'accès détaillé pour protéger les données de votre domaine et de contrôler davantage les autorisations qui accordent à votre rôle de service de base de connaissances l'accès au OpenSearch domaine et l'envoi de demandes.
-
Conservez les valeurs par défaut de tous les autres paramètres et choisissez Créer pour créer votre domaine.
-
-
Une fois le domaine créé, cliquez dessus pour prendre note de l'ARN du domaine et du point de terminaison du domaine lorsque vous créez la base de connaissances.
-
Après avoir créé le domaine, vous pouvez créer un index vectoriel en exécutant les commandes suivantes sur un OpenSearch tableau de bord ou en utilisant les commandes curl. Pour plus d’informations, consultez la documentation OpenSearch
. Lors de l'exécution de la commande :
-
Donnez un nom au champ vectoriel (par exemple,
embeddings
). -
Assurez-vous que le vecteur utilisé pour la recherche est faiss. nmslib n'est pas pris en charge.
-
Pour connaître le nombre de dimensions du vecteur, reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir :
Note
Le modèle Titan V2 Embeddings - Text prend en charge plusieurs dimensions. Il peut également être 256 ou 512.
Modèle Dimensions TitanIntégrations G1 - Texte 1 536 TitanEmbeddings V2 - Texte 1 024, 512 et 256 CohereEmbedAnglais 1,024 CohereEmbedMultilingue 1,024 -
Vous pouvez ajouter deux champs pour configurer l'index vectoriel afin de stocker des métadonnées supplémentaires qu'une base de connaissances peut récupérer à l'aide de vecteurs. Le tableau suivant décrit les champs et les valeurs à spécifier pour chacun d'entre eux.
Description du champ Champ de mappage Amazon Bedrock découpe le texte brut de vos données et stocke les fragments dans ce champ. Spécifié en tant qu'objet, par exemple, AMAZON_BEDROCK_TEXT_CHUNK
.Amazon Bedrock stocke les métadonnées relatives à votre base de connaissances dans ce domaine. Spécifié en tant qu'objet, par exemple, AMAZON_BEDROCK_METADATA
.
PUT /
<index-name>
{ "settings": { "index": { "knn": true } }, "mappings": { "properties": { "<vector-name>
": { "type": "knn_vector", "dimension":<embedding-dimension>
, "data_type": "binary", # Only needed for binary embeddings "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings "method": { "name": "hnsw", "engine": "faiss", "parameters": { "ef_construction": 128, "m": 24 } } }, "AMAZON_BEDROCK_METADATA": { "type": "text", "index": "false" }, "AMAZON_BEDROCK_TEXT_CHUNK": { "type": "text", "index": "true" } } } } -
-
Prenez note de l'ARN du domaine et du point de terminaison, ainsi que des noms que vous choisissez pour le nom de l'index vectoriel, le nom du champ vectoriel et les noms des champs de mappage de gestion des métadonnées lorsque vous créez votre base de connaissances.
Une fois l'index vectoriel créé, vous pouvez créer votre base de connaissances. Le tableau suivant indique où vous allez entrer chaque information dont vous avez pris note.
Champ Champ correspondant dans la configuration de la base de connaissances (console) Champ correspondant dans la configuration de la base de connaissances (API) Description ARN du domaine ARN du domaine ARN du domaine Le nom de ressource Amazon (ARN) du OpenSearch domaine. Point de terminaison de domaine Point de terminaison de domaine Endpoint de domaine Le point de terminaison pour se connecter au OpenSearch domaine. Nom de l'index vectoriel Nom de l'index vectoriel vectorIndexName Nom de l'index vectoriel. Nom du champ vectoriel Champ vectoriel Champ vectoriel Nom du champ dans lequel vous souhaitez stocker les intégrations vectorielles pour vos sources de données. Gestion des métadonnées (premier champ de mappage) Champ de texte Champ de texte Nom du champ dans lequel vous souhaitez stocker le texte brut issu de vos sources de données. Gestion des métadonnées (deuxième champ de mappage) Champ de métadonnées géré par Bedrock Champ de métadonnées Nom du champ dans lequel stocker les métadonnées gérées par Amazon Bedrock. -
- Amazon S3 Vectors
-
Amazon S3 Vectors fournit un stockage vectoriel rentable dans Amazon S3 qui peut être utilisé pour stocker et interroger des données vectorielles. Il fournit un stockage durable et élastique de grands ensembles de données vectorielles avec des performances de requête inférieures à la seconde. Les vecteurs Amazon S3 sont parfaitement adaptés aux charges de travail de requêtes peu fréquentes et peuvent contribuer à réduire les coûts lorsqu'ils sont utilisés dans des applications de génération augmentée par extraction (RAG) et de recherche sémantique.
Important
L'intégration d'Amazon S3 Vectors aux bases de connaissances Amazon Bedrock est en version préliminaire et est sujette à modification.
Amazon S3 Vectors introduit des compartiments vectoriels S3, que vous pouvez interroger en fonction de leur signification sémantique et de leur similitude. Il peut être utilisé pour fournir des temps de réponse aux requêtes inférieurs à la seconde et réduire les coûts tout en stockant, en accédant et en interrogeant des données vectorielles à grande échelle sans provisionner d'infrastructure. Dans un bucket vectoriel, vous pouvez organiser vos données vectorielles dans des index vectoriels. Votre compartiment vectoriel peut comporter plusieurs index vectoriels, et chaque index vectoriel peut contenir des millions de vecteurs. Pour plus d'informations, consultez la section Amazon S3 Vectors dans le guide de l'utilisateur Amazon S3.
Note
Vous pouvez créer une base de connaissances pour les vecteurs Amazon S3 dans tous les Région AWS sites où Amazon Bedrock et Amazon S3 Vectors sont disponibles. Pour plus d'informations sur la disponibilité régionale des vecteurs Amazon S3, consultez la section relative aux vecteurs Amazon S3 dans le guide de l'utilisateur Amazon S3.
Support des métadonnées
Après avoir créé un index vectoriel, lorsque vous ajoutez des données vectorielles à l'index, vous pouvez associer des métadonnées sous forme de paires clé-valeur à chaque vecteur. Par défaut, toutes les métadonnées associées à un vecteur sont filtrables et peuvent être utilisées comme filtres dans une requête de recherche de similarité. Les métadonnées filtrables peuvent être utilisées pour filtrer les requêtes entrantes en fonction d'un ensemble de conditions, telles que les dates, les catégories ou les préférences de l'utilisateur.
Vous pouvez également configurer les métadonnées pour qu'elles ne soient pas filtrables lors de la création de l'index vectoriel. Les index vectoriels Amazon S3 prennent en charge les types chaîne, booléen et numérique. Il peut prendre en charge jusqu'à 40 Ko de métadonnées pour chaque vecteur. Dans ces 40 Ko de métadonnées, les métadonnées filtrables peuvent atteindre un maximum de 2 Ko pour chaque vecteur. L'espace de métadonnées filtrable peut être utilisé pour stocker les intégrations après la création de la base de connaissances.
Si les métadonnées dépassent l'une de ces limites, cela entraîne une erreur lors de la création de l'index vectoriel. Pour plus d'informations, consultez la section Amazon S3 Vectors dans le guide de l'utilisateur Amazon S3.
Autorisations requises
Assurez-vous que votre politique IAM autorise Amazon Bedrock à accéder à votre index vectoriel dans le compartiment vectoriel S3. Pour plus d'informations sur les autorisations requises, consultez Création d'un rôle de service pour les bases de connaissances Amazon Bedrock.
Création d'un compartiment vectoriel et d'un index S3
Pour utiliser Amazon S3 Vectors avec votre base de connaissances, vous devez créer un compartiment vectoriel S3 et un index vectoriel. Vous pouvez créer un compartiment vectoriel et un index à l'aide de la console Amazon S3 ou du AWS SDK. AWS CLI Pour obtenir des instructions détaillées, consultez la section Création d'un index vectoriel dans le guide de l'utilisateur Amazon S3.
Tenez compte des considérations suivantes lors de la création de votre compartiment vectoriel et de votre index dans la console Amazon S3
. -
Lorsque vous créez votre compartiment vectoriel S3, tenez compte des considérations suivantes.
-
Fournissez un nom de compartiment vectoriel unique.
-
(Facultatif) Amazon S3 chiffre automatiquement les données à l'aide du chiffrement côté serveur par défaut avec les clés gérées par Amazon S3 (SSE-S3). Vous pouvez choisir d'utiliser ce chiffrement par défaut ou le chiffrement côté serveur avec des clés du service de gestion des AWS clés (SSE-KMS) à la place.
Note
Le type de chiffrement ne peut pas être modifié une fois le bucket vectoriel créé.
Pour step-by-step obtenir des instructions, consultez la section Chiffrement avec des clés AWS KMS.
-
-
Une fois que vous avez créé le compartiment vectoriel S3, prenez note du nom de ressource Amazon (ARN) du compartiment vectoriel lorsque vous créez la base de connaissances.
-
Choisissez le compartiment vectoriel que vous avez créé, puis créez un index vectoriel. Lors de la création de l'index vectoriel, tenez compte des considérations suivantes.
-
Nom de l'index vectoriel — Donnez un nom au champ (par exemple,
embeddings
). -
Dimension — Le nombre de dimensions du vecteur. Les dimensions doivent être une valeur comprise entre 1 et 4096. Reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir en fonction de votre sélection du modèle d'intégration :
Modèle Dimensions TitanIntégrations G1 - Texte 1 536 TitanEmbeddings V2 - Texte 1 024, 512 et 256 CohereEmbedAnglais 1,024 CohereEmbedMultilingue 1,024 -
Note
Les vecteurs Amazon S3 ne prennent en charge que les intégrations à virgule flottante. Les intégrations binaires ne sont pas prises en charge.
Métrique de distance : métrique utilisée pour mesurer la similarité entre les vecteurs. Vous pouvez utiliser Cosine ou Euclidean.
-
-
Développez les paramètres supplémentaires et saisissez toutes les métadonnées non filtrables dans le champ Métadonnées non filtrables.
Note
Si vous pensez que vos fragments de texte dépasseront l'espace de métadonnées de 2 Ko, nous vous recommandons d'ajouter le champ de texte en
AMAZON_BEDROCK_TEXT
tant que clé de métadonnées non filtrable. Votre base de connaissances utilisera ce champ pour stocker les fragments de texte.Vous pouvez configurer jusqu'à 10 clés de métadonnées non filtrables. Choisissez Ajouter une clé, puis Ajouter
AMAZON_BEDROCK_TEXT
en tant que clé. -
Créez l'index vectoriel et prenez note du nom de ressource Amazon (ARN) de l'index vectoriel lorsque vous créez la base de connaissances.
Création d'une base de connaissances pour le compartiment vectoriel S3
Après avoir rassemblé ces informations, vous pouvez créer votre base de connaissances. Lorsque vous créez votre base de connaissances avec le compartiment vectoriel S3, vous devez fournir l'ARN du compartiment vectoriel et l'index vectoriel. L'index vectoriel stockera les intégrations générées à partir de vos sources de données. Le tableau suivant récapitule l'endroit où vous allez saisir chaque information :
Champ Champ correspondant dans la configuration de la base de connaissances (console) Champ correspondant dans la configuration de la base de connaissances (API) Description Arn du bucket vectoriel ARN du bucket vectoriel S3 vectorBucketArn Le nom de ressource Amazon (ARN) de votre compartiment vectoriel S3. Indice vectoriel ARN ARN de l'index vectoriel S3 Arn d'index vectoriel Le nom de ressource Amazon (ARN) de l'index vectoriel de votre compartiment vectoriel S3. -
- Amazon Aurora (RDS)
-
-
Créez un cluster, un schéma et une table de base de données (DB) Amazon Aurora en suivant les étapes décrites dans la section Utilisation d'Aurora PostgreSQL comme base de connaissances. Lorsque vous créez la table, configurez-la avec les colonnes et types de données suivants. Vous pouvez utiliser les noms de colonne de votre choix au lieu de ceux répertoriés dans le tableau suivant. Prenez note des noms de colonne que vous choisissez afin de pouvoir les fournir lors de la configuration de la base de connaissances.
Vous devez renseigner ces champs avant de créer la base de connaissances. Ils ne peuvent pas être mis à jour une fois la base de connaissances créée.
Important
Le cluster Aurora doit résider dans le même emplacement Compte AWS que celui dans lequel la base de connaissances a été créée pour Amazon Bedrock.
Nom de la colonne Type de données Champ correspondant dans la configuration de la base de connaissances (console) Champ correspondant dans la configuration de la base de connaissances (API) Description id Clé primaire UUID Clé primaire primaryKeyField
Contient des identifiants uniques pour chaque enregistrement. embedding Vector Champ vectoriel vectorField
Contient les intégrations vectorielles des sources de données. morceaux Texte Champ de texte textField
Contient les segments de texte brut provenant de vos sources de données. métadonnées JSON Champ de métadonnées géré par Bedrock metadataField
Contient les métadonnées nécessaires pour effectuer l’attribution de la source et pour permettre l’ingestion et l’interrogation des données métadonnées_personnalisées JSONB Champ de métadonnées personnalisé customMetadataField
Champ facultatif qui indique la colonne dans laquelle Amazon Bedrock rédigera toutes les informations des fichiers de métadonnées provenant de vos sources de données. -
Vous devez créer un index sur le vecteur des colonnes et le texte pour vos champs de texte et d'intégration. Si vous utilisez le champ de métadonnées personnalisé, vous devez également créer un index GIN sur cette colonne. Les index GIN peuvent être utilisés pour rechercher efficacement des paires clé-valeur dans des documents jsonb à des fins de filtrage des métadonnées. Pour plus d'informations, consultez la section indexation jsonb
dans la documentation de PostgreSQL. Nom de la colonne Créer un index sur Obligatoire ? vecteur CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops);
Oui text CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (to_tsvector('simple', chunks));
Oui métadonnées personnalisées CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (custom_metadata);
Uniquement si vous avez créé la colonne de métadonnées personnalisée. -
(Facultatif) Si vous avez ajouté des métadonnées à vos fichiers à des fins de filtrage, nous vous recommandons de fournir le nom de colonne dans le champ de métadonnées personnalisé afin de stocker toutes vos métadonnées dans une seule colonne. Lors de l'ingestion des données, cette colonne sera remplie avec toutes les informations contenues dans les fichiers de métadonnées provenant de vos sources de données. Si vous choisissez de fournir ce champ, vous devez créer un index GIN sur cette colonne.
Note
Si vous utilisez fréquemment des filtres de plage sur des métadonnées numériques, créez un index pour la clé spécifique afin d'optimiser les performances. Par exemple, si vous utilisez des filtres tels que
"lessThan": { "key": "year", "value": 1989 }
, créez un index d'expression sur layear
clé. Pour plus d'informations, consultez la section Index des expressionsdans la documentation de PostgreSQL. CREATE INDEX ON your_table ((custom_metadata->>'year')::double precision
Sinon, si vous ne fournissez pas ce nom de champ, vous pouvez créer une colonne pour chaque attribut de métadonnées de vos fichiers et spécifier le type de données (texte, nombre ou booléen). Par exemple, si l'attribut
genre
existe dans votre source de données, vous devez ajouter une colonne nomméegenre
et spécifiertext
comme type de données. Lors de l'ingestion des données, ces colonnes distinctes seront remplies avec les valeurs d'attribut correspondantes. -
Configurez un AWS Secrets Manager secret pour votre cluster de base de données Aurora en suivant les étapes décrites dans Gestion des mots de passe avec Amazon Aurora et AWS Secrets Manager.
-
Prenez note des informations suivantes après avoir le votre cluster de bases de données et après avoir configuré le secret.
Champ dans la configuration de la base de connaissances (console) Champ dans la configuration de la base de connaissances (API) Description ARN du cluster de bases de données Amazon Aurora resourceArn ARN du cluster de bases de données. Nom de base de données databaseName Nom de la base de données. Nom de la table tableName Nom de la table dans le cluster de bases de données ARN du secret credentialsSecretArn L'ARN de la AWS Secrets Manager clé pour votre cluster de base de données
-
- Neptune Analytics graphs (GraphRAG)
-
-
Pour créer un graphe et un magasin vectoriel dans Neptune Analytics dans le AWS Management Console, suivez les étapes décrites dans la section Indexation vectorielle dans Neptune Analytics du guide de l'utilisateur de Neptune Analytics.
Note
Pour utiliser Neptune GraphRag, créez un graphe Neptune Analytics vide avec un index de recherche vectoriel. L'index de recherche vectorielle ne peut être créé que lorsque le graphe est créé. Lorsque vous créez un graphe Neptune Analytics dans la console, vous spécifiez la dimension de l'index dans les paramètres de recherche vectorielle vers la fin du processus.
Tenez compte des considérations suivantes lors de la création du graphique :
-
Donnez au graphique le nom de votre choix.
-
Sous Source de données, choisissez Créer un graphique vide et spécifiez le nombre de m- NCUs à allouer. Chaque m-NCU possède une capacité de mémoire d'environ un GiB, ainsi que des capacités de calcul et de mise en réseau correspondantes.
Note
La capacité de votre graphe peut être modifiée ultérieurement. Nous vous recommandons de commencer par la plus petite instance, puis d'en choisir une autre, si nécessaire.
-
Vous pouvez conserver les paramètres de connectivité réseau par défaut. Amazon Bedrock créera une connexion réseau avec le graphe Neptune Analytics auquel vous associez la base de connaissances. Il n'est pas nécessaire de configurer la connectivité publique ou les points de terminaison privés pour votre graphe.
-
Sous Paramètres de recherche vectorielle, choisissez Utiliser la dimension vectorielle et spécifiez le nombre de dimensions de chaque vecteur.
Note
Le nombre de dimensions de chaque vecteur doit correspondre aux dimensions vectorielles du modèle d'intégration. Reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir :
Modèle Dimensions TitanIntégrations G1 - Texte 1 536 TitanEmbeddings V2 - Texte 1 024, 512 et 256 CohereEmbedAnglais 1,024 CohereEmbedMultilingue 1,024 -
Conservez les paramètres par défaut pour tous les autres paramètres et créez le graphique.
-
-
Une fois le graphique créé, cliquez dessus pour prendre note des dimensions ARN et vecteur des ressources lorsque vous créez la base de connaissances. Lorsque vous choisissez le modèle d'intégration dans Amazon Bedrock, assurez-vous de choisir un modèle ayant les mêmes dimensions que les dimensions vectorielles que vous avez configurées sur votre graphique Neptune Analytics.
Une fois l'index vectoriel créé, vous pouvez créer votre base de connaissances. Le tableau suivant indique où vous allez entrer chaque information dont vous avez pris note.
Champ Champ correspondant dans la configuration de la base de connaissances (console) Champ correspondant dans la configuration de la base de connaissances (API) Description ARN du graphique ARN du graphe Neptune Analytics Graphique RN Le nom de ressource Amazon (ARN) du graphe Neptune Analytics. Gestion des métadonnées (premier champ de mappage) Nom du champ de texte Champ de texte Nom du champ dans lequel vous souhaitez stocker le texte brut issu de vos sources de données. Vous pouvez fournir n'importe quelle valeur pour ce champ, par exemple du texte. Gestion des métadonnées (deuxième champ de mappage) Champ de métadonnées géré par Bedrock Champ de métadonnées Nom du champ dans lequel stocker les métadonnées gérées par Amazon Bedrock. Vous pouvez fournir n'importe quelle valeur pour ce champ, par exemple des métadonnées. -
- Pinecone
-
Note
Si vous l'utilisezPinecone, vous acceptez d'autoriser l'accès AWS à la source tierce désignée en votre nom afin de vous fournir des services de boutique vectorielle. Vous êtes tenu de respecter toutes les conditions de tiers applicables pour l'utilisation et le transfert de données à partir du service tiers.
Pour une documentation détaillée sur la configuration d'un magasin vectoriel dansPinecone, consultez Pinecone en tant que base de connaissances pour Amazon Bedrock
. Lorsque vous configurez le stockage vectoriel, prenez note des informations suivantes, que vous renseignerez lors de la création d’une base de connaissances :
-
URL du point de terminaison : URL du point de terminaison de votre page de gestion d'index.
-
ARN secret des informations d'identification : nom de ressource Amazon (ARN) du secret que vous avez créé et AWS Secrets Manager qui contient le nom d'utilisateur et le mot de passe d'un utilisateur de base de données.
-
(Facultatif) Clé KMS gérée par le client pour votre ARN secret d'identification : si vous avez chiffré l'ARN secret de vos informations d'identification, fournissez la clé KMS afin qu'Amazon Bedrock puisse la déchiffrer.
-
Espace de noms — (Facultatif) L'espace de noms à utiliser pour écrire de nouvelles données dans votre base de données. Pour plus d’informations, consultez Utilisation d’espaces de noms
.
Vous devez fournir des configurations supplémentaires lors de la création d'un Pinecone index :
-
Nom du champ de texte : nom du champ dans lequel Amazon Bedrock doit stocker le texte brut.
-
Nom du champ de métadonnées : nom du champ dans lequel Amazon Bedrock doit stocker les métadonnées d'attribution de source.
Pour accéder à votre Pinecone index, vous devez fournir votre clé Pinecone d'API à Amazon Bedrock via le AWS Secrets Manager.
Pour définir un secret pour votre Pinecone configuration
-
Suivez les étapes décrites dans Créer un AWS Secrets Manager secret, en définissant la clé
apiKey
et la valeur comme clé d'API pour accéder à votre Pinecone index. -
Pour trouver votre clé d’API, ouvrez la console Pinecone
et sélectionnez Clés d’API. -
Après avoir créé le secret, prenez note de l’ARN de la clé KMS.
-
Associez des autorisations à votre fonction du service pour déchiffrer l’ARN de la clé KMS en suivant les étapes décrites dans Autorisations permettant de déchiffrer un AWS Secrets Manager secret pour le magasin de vecteurs contenant votre base de connaissances.
-
Ultérieurement, lorsque vous créerez votre base de connaissances, entrez l’ARN dans le champ ARN secret des informations d’identification.
-
- Redis Enterprise Cloud
-
Note
Si vous l'utilisezRedis Enterprise Cloud, vous acceptez d'autoriser l'accès AWS à la source tierce désignée en votre nom afin de vous fournir des services de boutique vectorielle. Vous êtes responsable du respect de toutes les conditions de tiers applicables à l'utilisation et au transfert de données depuis le service tiers.
Pour une documentation détaillée sur la configuration d'un magasin vectoriel dansRedis Enterprise Cloud, consultez la section Intégration Redis Enterprise Cloud à Amazon Bedrock
. Lorsque vous configurez le stockage vectoriel, prenez note des informations suivantes, que vous renseignerez lors de la création d’une base de connaissances :
-
URL du point de terminaison : URL du point de terminaison public de votre base de données.
-
Nom de l'index vectoriel : nom de l'index vectoriel de votre base de données.
-
Champ vectoriel : nom du champ dans lequel les intégrations vectorielles seront stockées. Reportez-vous au tableau suivant pour déterminer le nombre de dimensions que le vecteur doit contenir.
Modèle Dimensions TitanIntégrations G1 - Texte 1 536 TitanEmbeddings V2 - Texte 1 024, 512 et 256 CohereEmbedAnglais 1,024 CohereEmbedMultilingue 1,024 -
Champ de texte : nom du champ dans lequel Amazon Bedrock stocke les parties de texte brut.
-
Champ de métadonnées géré par Bedrock : nom du champ dans lequel Amazon Bedrock stocke les métadonnées relatives à votre base de connaissances.
Pour accéder à votre Redis Enterprise Cloud cluster, vous devez fournir votre configuration Redis Enterprise Cloud de sécurité à Amazon Bedrock via le AWS Secrets Manager.
Pour définir un secret pour votre Redis Enterprise Cloud configuration
-
Activez TLS pour utiliser la base de données avec Amazon Bedrock en suivant les étapes décrites dans Transport Layer Security (TLS)
. -
Suivez les étapes décrites dans la section Créer un AWS Secrets Manager secret. Configurez les clés suivantes avec les valeurs appropriées de votre Redis Enterprise Cloud configuration dans le secret :
-
username
— Le nom d'utilisateur pour accéder à votre Redis Enterprise Cloud base de données. Pour trouver votre nom d’utilisateur, consultez la section Sécurité de votre base de données dans la console Redis. -
password
— Le mot de passe pour accéder à votre Redis Enterprise Cloud base de données. Pour trouver votre mot de passe, consultez la section Sécurité de votre base de données dans la console Redis. -
serverCertificate
: contenu du certificat délivré par l’autorité de certification Redis Cloud. Téléchargez le certificat de serveur depuis la console d’administration Redis en suivant les étapes de la section Télécharger les certificats. -
clientPrivateKey
: clé privée du certificat délivré par l’autorité de certification Redis Cloud. Téléchargez le certificat de serveur depuis la console d’administration Redis en suivant les étapes de la section Télécharger les certificats. -
clientCertificate
: clé publique du certificat délivré par l’autorité de certification Redis Cloud. Téléchargez le certificat de serveur depuis la console d’administration Redis en suivant les étapes de la section Télécharger les certificats.
-
-
Après avoir créé le secret, prenez note de son ARN. Ultérieurement, lorsque vous créerez votre base de connaissances, entrez l’ARN dans le champ ARN secret des informations d’identification.
-
- MongoDB Atlas
-
Note
Si vous utilisez MongoDB Atlas, vous acceptez d'autoriser l'accès AWS à la source tierce désignée en votre nom afin de vous fournir des services de boutique vectorielle. Vous êtes tenu de respecter toutes les conditions de tiers applicables pour l'utilisation et le transfert de données à partir du service tiers.
Pour une documentation détaillée sur la configuration d'un magasin vectoriel dans MongoDB Atlas, voir Lancer un flux de travail RAG entièrement géré avec MongoDB Atlas
et Amazon Bedrock. Lorsque vous configurez le magasin vectoriel, notez les informations suivantes que vous ajouterez lors de la création d'une base de connaissances :
-
URL du point de terminaison : URL du point de terminaison de votre cluster MongoDB Atlas.
-
Nom de la base de données : nom de la base de données de votre cluster MongoDB Atlas.
-
Nom de la collection : nom de la collection dans votre base de données.
-
ARN secret des informations d'identification : nom de ressource Amazon (ARN) du secret que vous avez créé et AWS Secrets Manager qui contient le nom d'utilisateur et le mot de passe d'un utilisateur de base de données dans votre cluster MongoDB Atlas.
-
(Facultatif) Clé KMS gérée par le client pour votre ARN secret d'identification : si vous avez chiffré l'ARN secret de vos informations d'identification, fournissez la clé KMS afin qu'Amazon Bedrock puisse la déchiffrer.
Il existe des configurations supplémentaires pour le mappage de champs que vous devez fournir lors de la création d'un index MongoDB Atlas :
-
Nom de l'index vectoriel : nom de l'index de recherche vectorielle MongoDB Atlas de votre collection.
-
Nom du champ vectoriel : nom du champ dans lequel Amazon Bedrock doit stocker les intégrations vectorielles.
-
Nom du champ de texte : nom du champ dans lequel Amazon Bedrock doit stocker le texte brut.
-
Nom du champ de métadonnées : nom du champ dans lequel Amazon Bedrock doit stocker les métadonnées d'attribution de source.
-
(Facultatif) Nom de l'index de recherche textuel : nom de l'index MongoDB Atlas Search de votre collection.
(Facultatif) Pour qu'Amazon Bedrock se connecte à votre cluster MongoDB Atlas, consultez le flux de travail AWS PrivateLink RAG avec MongoDB
Atlas à l'aide d'Amazon Bedrock. -