Ingestion des modifications directement dans une base de connaissances - Amazon Bedrock

Ingestion des modifications directement dans une base de connaissances

Les bases de connaissances Amazon Bedrock vous permettent de modifier votre source de données et de synchroniser les modifications en une seule étape. Vous pouvez tirer parti de cette fonctionnalité si votre base de connaissances est connectée à l’un des types de sources de données suivants :

  • Amazon S3

  • Personnalisé

Grâce à l’ingestion directe, vous pouvez directement ajouter, mettre à jour ou supprimer des fichiers dans une base de connaissances en une seule action et votre base de connaissances peut accéder aux documents sans avoir besoin de les synchroniser. L’ingestion directe utilise les opérations d’API KnowledgeBaseDocuments pour indexer les documents que vous soumettez directement dans le magasin de vecteurs configuré pour la base de connaissances. Vous pouvez également consulter les documents de votre base de connaissances directement à l’aide de ces opérations, sans avoir à accéder à la source de données connectée.

Différences par rapport à la synchronisation d’une source de données

Les bases de connaissances Amazon Bedrock proposent également un ensemble d’opérations de l’API IngestionJob liées à la synchronisation de votre source de données. Lorsque vous synchronisez votre source de données avec une demande StartIngestionJob, les bases de connaissances Amazon Bedrock analysent chaque document de la source de données connectée et vérifient s’il a déjà été indexé dans le magasin de vecteurs configuré pour la base de connaissances. Si ce n’est pas le cas, il est indexé dans le magasin de vecteurs.

Avec une demande IngestKnowledgeBaseDocuments, vous soumettez un ensemble de documents à indexer directement dans le magasin de vecteurs. Par conséquent, vous ignorez l’étape consistant à ajouter des documents dans la source de données. Consultez les paragraphes suivants pour comprendre le cas d’utilisation de ces deux ensembles d’opérations d’API :

Si vous utilisez une source de données personnalisée

Vous n’avez pas besoin de synchroniser ou d’utiliser les opérations IngestionJob. Les documents que vous ajoutez, modifiez ou supprimez lors des opérations KnowledgeBaseDocuments ou dans la AWS Management Console font partie à la fois de la source de données personnalisée et de votre base de connaissances.

Si vous utilisez une source de données Amazon S3

Vous utilisez les deux ensembles d’opérations dans différents cas d’utilisation :

  • Après avoir connecté la base de connaissances à la source de données S3 pour la première fois, vous devez synchroniser votre source de données dans la AWS Management Console ou en soumettant une demande StartIngestionJob via l’API Amazon Bedrock.

  • Indexez les documents dans le magasin de vecteurs configuré pour votre base de connaissances ou supprimez les documents indexés de la manière suivante :

    1. Ajoutez des documents dans votre emplacement S3 ou supprimez-en des documents. Synchronisez ensuite votre source de données dans la AWS Management Console ou soumettez une demande StartIngestionJob dans l’API. Pour plus de détails sur la synchronisation et l’opération StartIngestionJob, consultez Synchronisation de vos données avec votre base de connaissances Amazon Bedrock.

    2. Ingérez des documents S3 dans la base de connaissances directement à l’aide d’une demande IngestKnowledgeBaseDocuments. Pour plus de détails sur l’ingestion directe de documents, consultez Ingestion de documents directement dans une base de connaissances.

      Avertissement

      Pour les sources de données S3, les modifications que vous indexez dans la base de connaissances directement dans la AWS Management Console ou avec les opérations de l’API KnowledgeBaseDocuments ne sont pas reflétées dans l’emplacement S3. Vous pouvez utiliser ces opérations d’API pour rendre immédiatement disponibles les modifications apportées à votre base de connaissances en une seule étape. Cependant, vous devez effectuer les mêmes modifications dans votre emplacement S3 afin qu’elles ne soient pas remplacées la prochaine fois que vous synchroniserez votre source de données dans la AWS Management Console ou avec StartIngestionJob.

      Ne soumettez pas simultanément une demande IngestKnowledgeBaseDocuments et StartIngestionJob.

Sélectionnez une rubrique pour savoir comment procéder à l’ingestion directe des documents contenus dans vos sources de données :