Modification d’une source de données pour votre base de connaissances Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Modification d’une source de données pour votre base de connaissances Amazon Bedrock

Vous pouvez mettre à jour une source de données pour votre base de connaissances, par exemple en modifiant les configurations des sources de données.

Vous pouvez mettre à jour une source de données de l’une des façons suivantes :

  • Ajout, modification ou suppression de fichiers ou de contenu de la source de données.

  • Modification des configurations des sources de données ou de la clé KMS à utiliser pour le chiffrage des données transitoires lors de l’ingestion de données. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant).

  • Définition de votre politique de suppression des sources de données sur « Supprimer » ou « Retenir ». Vous pouvez supprimer toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Vous pouvez conserver toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.

Chaque fois que vous ajoutez, modifiez ou supprimez des fichiers de votre source de données, vous devez synchroniser cette dernière afin qu’elle soit réindexée dans la base de connaissances. La synchronisation étant incrémentielle, Amazon Bedrock ne traite que les documents ajoutés, modifiés ou supprimés depuis la dernière synchronisation. Avant de commencer l’ingestion, vérifiez que votre source de données remplit les conditions suivantes :

  • Le format des fichiers est pris en charge. Pour plus d’informations, consultez Formats de documents pris en charge.

  • Les fichiers ne dépassent pas la taille des fichiers de tâche d’ingestion spécifiée dans Points de terminaison et quotas Amazon Bedrock dans les Références générales AWS.

  • Si votre source de données contient des fichiers de métadonnées, vérifiez les conditions suivantes pour vous assurer qu’ils ne sont pas ignorés :

    • Chaque fichier .metadata.json porte le même nom et la même extension que le fichier source auquel il est associé.

    • Si l’index vectoriel de votre base de connaissances se trouve dans un magasin de vecteurs Amazon OpenSearch sans serveur, vérifiez qu’il est configuré avec le moteur faiss. Si l’index vectoriel est configuré avec le moteur nmslib, vous devrez effectuer l’une des opérations suivantes :

    • Si l’index vectoriel de votre base de connaissances se trouve dans un cluster de bases de données Amazon Aurora, nous vous recommandons d’utiliser le champ de métadonnées personnalisées pour stocker toutes vos métadonnées dans une seule colonne et de créer un index sur cette colonne. Si vous ne fournissez pas de champ de métadonnées personnalisées, vous devez vérifier que le tableau de votre index contient une colonne pour chaque propriété de métadonnées de vos fichiers de métadonnées avant de commencer l’ingestion. Pour plus d’informations, consultez Conditions préalables à l’utilisation d’un magasin de vecteurs que vous avez créé pour une base de connaissances.

Pour découvrir comment mettre à jour une source de données, cliquez sur l’onglet correspondant à votre méthode préférée, puis suivez les étapes :

Console
Pour mettre à jour une source de données
  1. Connectez-vous à la AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ensuite, ouvrez la console Amazon Bedrock à l’adresse https://console.aws.amazon.com/bedrock.

  2. Dans le volet de navigation de gauche, sélectionnez Bases de connaissances.

  3. Sélectionnez le nom de votre base de connaissances.

  4. Dans la section Source de données, activez la case d’option près de la source de données que vous souhaitez modifier et synchroniser.

  5. (Facultatif) Choisissez Modifier, changez vos configurations, puis sélectionnez Soumettre. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant). Notez également qu’il n’est pas possible de modifier les configurations de découpage basées sur les données d’origine ingérées. Vous devez recréer la source de données.

    Note

    Vous ne pouvez pas modifier les configurations de découpage. Vous devez recréer la source de données.

  6. (Facultatif) Choisissez de modifier la politique de suppression des données de votre source de données dans le cadre des paramètres avancés :

    Pour les paramètres de politique de suppression des données, vous pouvez choisir l’une des options suivantes :

    • Supprimer : vous pouvez supprimer toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé, seules les données le sont. Cet indicateur est ignoré si un compte AWS est supprimé.

    • Retenir : vous pouvez conserver toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.

  7. Choisissez Synchronisation.

  8. Une bannière verte apparaît lorsque la synchronisation est terminée et que le statut devient Prêt.

API
Pour mettre à jour une source de données
  1. (Facultatif) Envoyez une demande UpdateDataSource avec un point de terminaison de compilation pour agents Amazon Bedrock, en modifiant n’importe quelle configuration et en spécifiant les mêmes configurations que vous ne souhaitez pas modifier. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant).

    Note

    Vous pouvez modifier chunkingConfiguration. Envoyez la demande avec la source de données existante chunkingConfiguration ou recréez la source de données.

  2. (Facultatif) Modifiez dataDeletionPolicy pour la source de données. Vous pouvez supprimer (DELETE) toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Cet indicateur est ignoré si un compte AWS est supprimé. Vous pouvez conserver (RETAIN) toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.

  3. Envoyez une demande StartIngestionJob avec un point de terminaison de compilation pour agents Amazon Bedrock, en spécifiant les ID dataSourceId et knowledgeBaseId.