Synchronisation de vos données avec votre base de connaissances Amazon Bedrock
Après avoir créé votre base de connaissances, vous devez ingérer ou synchroniser vos données afin qu’elles puissent être interrogées. L’ingestion convertit les données brutes de votre source de données en vectorisations, sur la base du modèle de vectorisation et des configurations que vous avez spécifiés.
Avant de commencer l’ingestion, vérifiez que votre source de données remplit les conditions suivantes :
-
Vous avez configuré les informations de connexion pour votre source de données. Pour configurer un connecteur de source de données afin d’analyser vos données depuis votre référentiel de sources de données, consultez Connecteurs de source de données pris en charge. Vous configurez votre source de données dans le cadre de la création de votre base de connaissances.
-
Vous avez configuré le modèle de vectorisation et le magasin de vecteurs que vous avez choisis. Consultez les modèles de vectorisation pris en charge et les magasins de vecteurs pour les bases de connaissances. Vous configurez vos vectorisations dans le cadre de la création de votre base de connaissances.
-
Le format des fichiers est pris en charge. Pour plus d’informations, consultez Formats de documents pris en charge.
-
Les fichiers ne dépassent pas la taille des fichiers de tâche d’ingestion spécifiée dans Points de terminaison et quotas Amazon Bedrock dans les Références générales AWS.
-
Si votre source de données contient des fichiers de métadonnées, vérifiez les conditions suivantes pour vous assurer qu’ils ne sont pas ignorés :
-
Chaque fichier
.metadata.jsonporte le même nom et la même extension que le fichier source auquel il est associé. -
Si l’index vectoriel de votre base de connaissances se trouve dans un magasin de vecteurs Amazon OpenSearch sans serveur, vérifiez qu’il est configuré avec le moteur
faiss. Si l’index vectoriel est configuré avec le moteurnmslib, vous devrez effectuer l’une des opérations suivantes :-
Créer une nouvelle base de connaissances dans la console et laisser Amazon Bedrock créer automatiquement pour vous un index vectoriel dans Amazon OpenSearch sans serveur
-
Créer un autre index vectoriel dans le magasin de vecteurs et sélectionner
faisscomme moteur Créer ensuite une base de connaissances et spécifier le nouvel index vectoriel
-
-
Si l’index vectoriel de votre base de connaissances se trouve dans un cluster de bases de données Amazon Aurora, nous vous recommandons d’utiliser le champ de métadonnées personnalisées pour stocker toutes vos métadonnées dans une seule colonne et de créer un index sur cette colonne. Si vous ne fournissez pas de champ de métadonnées personnalisées, vous devez vérifier que le tableau de votre index contient une colonne pour chaque propriété de métadonnées de vos fichiers de métadonnées avant de commencer l’ingestion. Pour plus d’informations, consultez Conditions préalables à l’utilisation d’un magasin de vecteurs que vous avez créé pour une base de connaissances.
-
Chaque fois que vous ajoutez, modifiez ou supprimez des fichiers de votre source de données, vous devez synchroniser cette dernière afin qu’elle soit réindexée dans la base de connaissances. La synchronisation étant incrémentielle, Amazon Bedrock ne traite que les documents ajoutés, modifiés ou supprimés depuis la dernière synchronisation.
Pour découvrir comment intégrer vos données dans votre base de connaissances et les synchroniser avec vos données les plus récentes, choisissez l’onglet correspondant à votre méthode préférée, puis suivez les étapes :