View a markdown version of this page

Bibliothèque d'automatisation des données - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Bibliothèque d'automatisation des données

La bibliothèque d'automatisation des données AWS Bedrock vous permet d'améliorer la compréhension de votre contenu par BDA et de générer des informations plus précises à partir de vos données. Une bibliothèque d'automatisation des données sert de conteneur qui stocke les entités et peut être associée à des projets BDA afin d'améliorer la précision d'extraction entre plusieurs types d'entités et modalités pour vos cas d'utilisation spécifiques. Actuellement, la bibliothèque d'automatisation des données prend en charge le vocabulaire personnalisé afin d'améliorer la précision d'extraction du contenu audio et vidéo. Les limites associées à cette fonctionnalité se trouvent sur la page Quotas et limites.

Principaux avantages

  1. Précision améliorée : adaptez la reconnaissance à vos besoins spécifiques.

  2. Support multimodal : amélioration de l'analyse audio et vidéo.

  3. Gestion flexible : créez, mettez à jour et associez facilement des projets.

  4. Ressources réutilisables : créez des bibliothèques une seule fois et utilisez-les dans plusieurs projets.

  5. Intégration facile : flux de travail simple piloté par API pour la gestion des bibliothèques.

Comment fonctionne la bibliothèque d'automatisation des données

Vous pouvez créer une bibliothèque d'automatisation des données et la remplir avec des entités spécifiques au domaine, ce qui permet à BDA d'appliquer vos connaissances personnalisées lors du traitement du contenu et d'améliorer la précision d'extraction dans tous vos cas d'utilisation. Vous pouvez associer une bibliothèque à un projet BDA, ce qui permet à toutes les tâches traitées dans le cadre de ce projet de tirer automatiquement parti des entités de la bibliothèque sans configuration supplémentaire par tâche.

Lorsque l'ingestion est terminée, un dossier portant le nom de l'ID de tâche est créé dans l'URI S3 fourni dans la demande d'API d'ingestion. Le manifeste d'entrée et les résultats de l'ingestion finale sont téléchargés dans ce dossier. Par exemple, si le bucket de sortie fourni dans la demande est s3://my-bucket/outputs/ et que le JoBid est le même328c43e7-d226-41c9-9acb-e71a37022b99, le manifeste d'entrée et les résultats d'ingestion finaux sont téléchargés dans s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99

Flux de travail de base :

  1. Créer une bibliothèque : CreateDataAutomationLibraryà utiliser pour initialiser un conteneur de bibliothèque vide.

  2. Ajouter des entités à votre bibliothèque : InvokeDataAutomationLibraryIngestionJobà utiliser pour ajouter des entités spécifiques à votre domaine.

  3. Associer la bibliothèque à un projet : liez la bibliothèque lors de la création d'un projet avec CreateDataAutomationProject, ou mettez à jour un projet existant avec UpdateDataAutomationProject.

  4. Traitez votre contenu : exécutez des tâches InvokeDataAutomationAsyncvia le projet associé pour appliquer une précision d'extraction améliorée à votre contenu.

Concepts clés

Bibliothèque d'automatisation des données

Conteneur qui stocke des entités d'un ou plusieurs types. Les bibliothèques peuvent être associées à plusieurs projets d'automatisation des données et réutilisées pour différentes charges de travail.

Type d'entité de bibliothèque d'automatisation des données

Type de contenu stocké dans la bibliothèque. Actuellement, seul le type d'entité VOCABULAIRE est pris en charge.

Entité de bibliothèque d'automatisation des données

Instance spécifique au sein d'un type d'entité. Pour le vocabulaire personnalisé, une entité représente un ensemble de mots et d'expressions pour une langue spécifique.

Job d'ingestion de bibliothèques d'automatisation des données

Opération asynchrone qui ajoute, met à jour ou supprime des entités dans une bibliothèque. Les tâches sont traitées de manière séquentielle afin de maintenir la cohérence des données.

Association du projet

Le lien entre une bibliothèque et un projet BDA. Lorsque vous associez une bibliothèque à un projet, toutes les tâches traitées dans le cadre de ce projet appliquent les entités de la bibliothèque afin d'améliorer la précision d'extraction de votre contenu. Notez qu'un projet ne peut être associé qu'à une seule bibliothèque, mais qu'une bibliothèque peut être associée à plusieurs projets.

Accès à la page de la bibliothèque d'automatisation des données dans la console BDA

  1. Accédez au service Amazon Bedrock.

  2. Dans le menu latéral, sélectionnez « Automatisation des données ».

  3. Sélectionnez « Gérer les bibliothèques »

Disponibilité par région

La bibliothèque d'automatisation des données est disponible dans les régions AWS suivantes :

Nom de la région

Code région

USA Est (Virginie du Nord)

us-east-1

USA Ouest (Oregon)

us-west-2

Europe (Irlande)

eu-west-1

Europe (Londres)

eu-west-2

Europe (Francfort)

eu-central-1

Asie-Pacifique (Mumbai)

ap-south-1

Asie-Pacifique (Sydney)

ap-southeast-2