Modification d’une source de données pour votre base de connaissances Amazon Bedrock

Vous pouvez mettre à jour une source de données pour votre base de connaissances, par exemple en modifiant les configurations des sources de données.

Vous pouvez mettre à jour une source de données de l’une des façons suivantes :

Ajout, modification ou suppression de fichiers ou de contenu de la source de données.
Modification des configurations des sources de données ou de la clé KMS à utiliser pour le chiffrage des données transitoires lors de l’ingestion de données. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant).
Définition de votre politique de suppression des sources de données sur « Supprimer » ou « Retenir ». Vous pouvez supprimer toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Vous pouvez conserver toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.

Chaque fois que vous ajoutez, modifiez ou supprimez des fichiers de votre source de données, vous devez synchroniser cette dernière afin qu’elle soit réindexée dans la base de connaissances. La synchronisation étant incrémentielle, Amazon Bedrock ne traite que les documents ajoutés, modifiés ou supprimés depuis la dernière synchronisation. Avant de commencer l’ingestion, vérifiez que votre source de données remplit les conditions suivantes :

Le format des fichiers est pris en charge. Pour plus d’informations, consultez Formats de documents pris en charge.
Les fichiers ne dépassent pas la taille des fichiers de tâche d’ingestion spécifiée dans Points de terminaison et quotas Amazon Bedrock dans les Références générales AWS.
Si votre source de données contient des fichiers de métadonnées, vérifiez les conditions suivantes pour vous assurer qu’ils ne sont pas ignorés :
- Chaque fichier .metadata.json porte le même nom et la même extension que le fichier source auquel il est associé.
- Si l'index vectoriel de votre base de connaissances se trouve dans un magasin de vecteurs Amazon OpenSearch Serverless, vérifiez qu'il est configuré avec le faiss moteur. Si l’index vectoriel est configuré avec le moteur nmslib, vous devrez effectuer l’une des opérations suivantes :
  - Créez une nouvelle base de connaissances dans la console et laissez Amazon Bedrock créer automatiquement un index vectoriel dans Amazon OpenSearch Serverless pour vous.
  - Créer un autre index vectoriel dans le magasin de vecteurs et sélectionner faiss comme moteur Créer ensuite une base de connaissances et spécifier le nouvel index vectoriel
- Si l’index vectoriel de votre base de connaissances se trouve dans un cluster de bases de données Amazon Aurora, nous vous recommandons d’utiliser le champ de métadonnées personnalisées pour stocker toutes vos métadonnées dans une seule colonne et de créer un index sur cette colonne. Si vous ne fournissez pas de champ de métadonnées personnalisées, vous devez vérifier que le tableau de votre index contient une colonne pour chaque propriété de métadonnées de vos fichiers de métadonnées avant de commencer l’ingestion. Pour plus d’informations, consultez Conditions préalables à l’utilisation d’un magasin de vecteurs que vous avez créé pour une base de connaissances.

Pour découvrir comment mettre à jour une source de données, cliquez sur l’onglet correspondant à votre méthode préférée, puis suivez les étapes :

Console

Pour mettre à jour une source de données

Connectez-vous au AWS Management Console avec une identité IAM autorisée à utiliser la console Amazon Bedrock. Ouvrez ensuite la console Amazon Bedrock à https://console.aws.amazon.com/bedrockl'adresse.
Dans le volet de navigation de gauche, sélectionnez Bases de connaissances.
Sélectionnez le nom de votre base de connaissances.
Dans la section Source de données, activez la case d’option près de la source de données que vous souhaitez modifier et synchroniser.
(Facultatif) Choisissez Modifier, changez vos configurations, puis sélectionnez Soumettre. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant). Notez également qu’il n’est pas possible de modifier les configurations de découpage basées sur les données d’origine ingérées. Vous devez recréer la source de données.

Note
Vous ne pouvez pas modifier les configurations de découpage. Vous devez recréer la source de données.
(Facultatif) Choisissez de modifier la politique de suppression des données de votre source de données dans le cadre des paramètres avancés :

Pour les paramètres de politique de suppression des données, vous pouvez choisir l’une des options suivantes :
- Supprimer : vous pouvez supprimer toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé, seules les données le sont. Ce drapeau est ignoré si un AWS compte est supprimé.
- Retenir : vous pouvez conserver toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.
Choisissez Synchronisation.
Une bannière verte apparaît lorsque la synchronisation est terminée et que le statut devient Prêt.

API

Pour mettre à jour une source de données

(Facultatif) Envoyez une UpdateDataSourcedemande à un point de terminaison Agents for Amazon Bedrock au moment de la création, en modifiant les configurations et en spécifiant les mêmes configurations que vous ne souhaitez pas modifier. Si vous modifiez les détails de configuration du point de terminaison ou de la source, vous devez mettre à jour le rôle IAM ou en créer un avec les autorisations d’accès requises et un secret Secrets Manager (le cas échéant).

Note
Vous pouvez modifier chunkingConfiguration. Envoyez la demande avec la source de données existante chunkingConfiguration ou recréez la source de données.
(Facultatif) Modifiez dataDeletionPolicy pour la source de données. Vous pouvez supprimer (DELETE) toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Ce drapeau est ignoré si un AWS compte est supprimé. Vous pouvez conserver (RETAIN) toutes les données de votre source de données converties en vectorisations lors de la suppression d’une ressource de type base de connaissances ou source de données. Notez que le magasin de vecteurs lui-même n’est pas supprimé si vous supprimez une ressource de type base de connaissances ou source de données.
Envoyez une StartIngestionJobdemande à un agent pour le point de terminaison Amazon Bedrock au moment de la création, en spécifiant le et ledataSourceId. knowledgeBaseId

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Affichage d’informations sur une source de données

Supprimer une source de données

Modification d’une source de données pour votre base de connaissances Amazon Bedrock

Pour mettre à jour une source de données

Note

Pour mettre à jour une source de données

Note