Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options d’analyse structurée pour votre source de données
L’analyse structurée fait référence à la compréhension et à l’extraction du contenu à partir de données brutes. Les bases de connaissances Amazon Bedrock proposent les options suivantes pour analyser votre source de données lors de l’ingestion :
-
Analyseur par défaut Amazon Bedrock : analyse uniquement le texte des fichiers texte, y compris les fichiers .txt, .md, .html, .doc/.docx, .xls/.xlsx et .pdf. Cet analyseur n’entraîne aucun frais d’utilisation.
Note
L’analyseur par défaut ne produisant que du texte, nous vous recommandons d’utiliser l’automatisation des données Amazon Bedrock ou un modèle de fondation comme analyseur plutôt que l’analyseur par défaut si vos documents incluent des figures, des graphiques, des tableaux ou des images. L’automatisation des données Amazon Bedrock et les modèles de fondation peuvent extraire ces éléments de vos documents et les renvoyer en sortie.
-
Amazon Bedrock Knowledge Bases propose les analyseurs suivants pour analyser les données multimodales, y compris les figures, graphiques et tableaux dans des fichiers .pdf, en plus des fichiers image .jpeg et .png. Ces analyseurs peuvent également extraire ces figures, graphiques, tableaux et images et les stocker sous forme de fichiers dans une destination S3 que vous spécifiez lors de la création de la base de connaissances. Lors de la récupération de la base de connaissances, ces fichiers peuvent être renvoyés dans la réponse ou dans l’attribution de la source.
-
Automatisation des données Amazon Bedrock : un service entièrement géré qui traite efficacement les données multimodales, sans qu’il soit nécessaire de fournir des instructions supplémentaires. Le coût de cet analyseur dépend du nombre de pages du document ou du nombre d’images à traiter. Pour plus d’informations sur ce service, consultez Automatisation des données Amazon Bedrock.
-
Modèles de fondation : traite les données multimodales à l’aide d’un modèle de fondation. Cet analyseur vous permet de personnaliser l’invite par défaut utilisée pour l’extraction des données. Le coût de cet analyseur dépend du nombre de jetons d’entrée et de sortie traités par le modèle de fondation. Pour obtenir la liste des modèles prenant en charge l’analyse des données Amazon Bedrock Knowledge Bases, consultez Modèles et régions pris en charge pour l’analyse.
-
Important
Si vous choisissez l’automatisation des données Amazon Bedrock ou les modèles de fondation comme analyseur, la méthode choisie sera utilisée pour analyser tous les fichiers .pdf de votre source de données, même s’ils ne contiennent que du texte. L’analyseur par défaut ne sera pas utilisé pour analyser ces fichiers .pdf. Des frais sont facturés à votre compte pour l’utilisation de l’automatisation des données Amazon Bedrock ou du modèle de fondation pour l’analyse de ces fichiers.
Quand vous choisissez une méthode d’analyse de vos données, tenez compte des points suivants :
-
Les données sont-elles purement textuelles ou contiennent-elles des données multimodales, telles que des images, des graphiques et des diagrammes, que vous souhaitez que la base de connaissances puisse interroger ?
-
Souhaitez-vous ou non avoir la possibilité de personnaliser l’invite utilisée pour indiquer au modèle comment analyser vos données ?
-
Le coût de l’analyseur. L’automatisation des données Amazon Bedrock applique une tarification par page, tandis que les analyseurs du modèle de fondation facturent en fonction des jetons d’entrée et de sortie. Pour plus d’informations, consultez Tarification d’Amazon Bedrock
. -
Limite de taille totale du fichier. Lorsque vous utilisez des modèles de base comme analyseur, la taille totale de tous les fichiers ne doit pas dépasser 100 Go.
Pour savoir comment configurer la méthode d’analyse de votre base de connaissances, consultez la configuration de connexion de votre source de données dans Connexion d’une source de données à votre base de connaissances.