Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Connexion de votre base de connaissances à une source de données personnalisée
Au lieu de choisir un service de source de données pris en charge, vous pouvez vous connecter à une source de données personnalisée pour bénéficier des avantages suivants :
-
Flexibilité et contrôle des types de données auxquels vous souhaitez que votre base de connaissances ait accès
-
Possibilité d’utiliser les opérations de l’API
KnowledgeBaseDocumentspour ingérer ou supprimer directement les documents sans avoir à synchroniser les modifications -
Possibilité de consulter les documents de votre source de données directement via l’API ou la console Amazon Bedrock
-
Possibilité de télécharger des documents dans la source de données directement dans le AWS Management Console ou de les ajouter en ligne.
-
Possibilité d’ajouter des métadonnées directement à chaque document lors de l’ajout ou de la mise à jour d’un document dans la source de données Pour plus d’informations sur l’utilisation des métadonnées pour le filtrage lors de l’extraction d’informations à partir d’une source de données, consultez l’onglet Métadonnées et filtrage dans Configuration et personnalisation de la génération de requêtes et de réponses.
Support de contenu multimodal
Les sources de données personnalisées prennent en charge le contenu multimodal, notamment les images, les fichiers audio et vidéo codés en base64 jusqu'à 10 Mo. Pour des conseils complets sur l'utilisation de contenus multimodaux, voirCréation d'une base de connaissances pour le contenu multimodal.
Pour connecter une base de connaissances à une source de données personnalisée, envoyez une CreateDataSourcedemande à un point de terminaison Agents for Amazon Bedrock Build-time. Spécifiez l’ID de la base de connaissances (knowledgeBaseId) à laquelle vous souhaitez vous connecter, attribuez un name à la source de données, puis spécifiez le champ type dans dataSourceConfiguration sur CUSTOM. Voici un exemple minimal de création de cette source de données :
PUT /knowledgebases/KB12345678/datasources/ HTTP/1.1 Content-type: application/json { "name": "MyCustomDataSource", "dataSourceConfiguration": { "type": "CUSTOM" } }
Vous pouvez inclure l’un des champs facultatifs suivants pour configurer la source de données :
| Champ | Cas d’utilisation |
|---|---|
| description | Pour fournir une description de la source de données. |
| clientToken | Pour garantir que la demande d’API n’est exécutée qu’une seule fois. Pour plus d’informations, consultez Garantie de l’idempotence. |
| serverSideEncryptionConfiguration | Pour spécifier une clé KMS personnalisée pour le stockage de données transitoires lors de la conversion de vos données en vectorisations. Pour de plus amples informations, consultez Chiffrement du stockage des données transitoires lors de l’ingestion de données. |
| dataDeletionPolicy | Pour configurer ce qu’il convient de faire avec les vectorisations de votre source de données dans votre magasin de vecteurs, si vous supprimez la source de données. Spécifiez RETAIN pour conserver les données dans le magasin de vecteurs ou l’option par défaut DELETE pour les supprimer. |
| vectorIngestionConfiguration | Pour configurer les options d’ingestion de la source de données. Voir ci-dessous pour plus d’informations. |
Le vectorIngestionConfiguration champ correspond à un VectorIngestionConfigurationobjet contenant les champs suivants :
-
chunkingConfiguration : pour configurer la stratégie à utiliser pour le découpage des documents de la source de données. Pour plus d’informations sur les stratégies de découpage, consultez Fonctionnement du découpage du contenu pour les bases de connaissances.
-
parsingConfiguration : pour configurer la stratégie à utiliser pour analyser la source de données. Pour plus d’informations sur les options d’analyse, consultez Options d’analyse structurée pour votre source de données.
-
customTransformationConfiguration — Pour personnaliser la façon dont les données sont transformées et pour appliquer une fonction Lambda pour une meilleure personnalisation. Pour plus d’informations sur la façon de personnaliser le découpage de vos données et le traitement de vos métadonnées avec une fonction Lambda, consultez Utilisation d’une fonction Lambda de transformation personnalisée pour définir la manière dont vos données sont ingérées.
Après avoir configuré votre source de données personnalisée, vous pouvez y ajouter des documents et les ingérer directement dans la base de connaissances. Contrairement à d’autres sources de données, vous n’avez pas besoin de synchroniser une source de données personnalisée. Pour découvrir comment ingérer directement des documents, consultez Ingestion des modifications directement dans une base de connaissances.