Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Biblioteca de automatización de datos
La biblioteca de automatización de datos de AWS Bedrock le permite mejorar la comprensión de su contenido por parte de BDA y generar información más precisa a partir de sus datos. Una biblioteca de automatización de datos sirve como contenedor en el que se almacenan las entidades y se puede asociar a los proyectos de la BDA para mejorar la precisión de la extracción en varios tipos y modalidades de entidades para sus casos de uso específicos. Actualmente, la biblioteca de automatización de datos admite el vocabulario personalizado para mejorar la precisión de extracción del contenido de audio y vídeo. Los límites relacionados con esta función se encuentran en la página de cuotas y límites.
Ventajas principales
Precisión mejorada: adapte el reconocimiento a sus necesidades específicas.
Soporte multimodal: mejore el análisis de audio y vídeo.
Administración flexible: cree, actualice y asocie proyectos fácilmente.
Recursos reutilizables: cree bibliotecas una vez y utilícelas en varios proyectos.
Integración sencilla: flujo de trabajo sencillo basado en API para la gestión de bibliotecas.
Cómo funciona la biblioteca de automatización de datos
Puede crear una biblioteca de automatización de datos y rellenarla con entidades específicas del dominio, lo que permite a BDA aplicar sus conocimientos personalizados durante el procesamiento del contenido y mejorar la precisión de la extracción en todos sus casos de uso. Puede asociar una biblioteca a un proyecto de BDA, lo que permite que todos los trabajos procesados a través de ese proyecto aprovechen automáticamente las entidades de la biblioteca sin necesidad de realizar configuraciones adicionales por trabajo.
Cuando se completa la ingestión, se crea una carpeta con el nombre del ID del trabajo en el URI de S3 proporcionado en la solicitud de API de ingestión. Tanto el manifiesto de entrada como los resultados finales de la ingesta se cargan en esa carpeta. Por ejemplo, si el segmento de salida proporcionado en la solicitud es s3://my-bucket/outputs/ y el JoBid es328c43e7-d226-41c9-9acb-e71a37022b99, el manifiesto de entrada y los resultados finales de la ingesta se cargan en s3://my-bucket/outputs/328c43e7-d226-41c9-9acb-e71a37022b99
Flujo de trabajo básico:
Crear una biblioteca: se utiliza CreateDataAutomationLibrarypara inicializar un contenedor de biblioteca vacío.
Añadir entidades a la biblioteca: se utiliza InvokeDataAutomationLibraryIngestionJobpara añadir las entidades específicas de su dominio.
Asocie la biblioteca a un proyecto: vincule la biblioteca durante la creación del proyecto o actualice un proyecto existente con CreateDataAutomationProjectél. UpdateDataAutomationProject
Procese su contenido: ejecute los trabajos utilizando el proyecto asociado para aplicar una precisión de extracción mejorada InvokeDataAutomationAsynca todo su contenido.
Conceptos clave
Biblioteca de automatización de datos
Un contenedor que almacena entidades de uno o más tipos. Las bibliotecas se pueden adjuntar a varios proyectos de automatización de datos y reutilizarse en diferentes cargas de trabajo.
Tipo de entidad de biblioteca de automatización de datos
El tipo de contenido almacenado en la biblioteca. Actualmente, solo se admite el tipo de entidad VOCABULARY.
Entidad de biblioteca de automatización de datos
Una instancia específica dentro de un tipo de entidad. En el caso del vocabulario personalizado, una entidad representa un conjunto de palabras y frases para un idioma específico.
Job de ingestión de bibliotecas de automatización de datos
Operación asíncrona que agrega, actualiza o elimina entidades de una biblioteca. Los trabajos se procesan secuencialmente para mantener la coherencia de los datos.
Asociación de proyectos
El vínculo entre una biblioteca y un proyecto de BDA. Al asociar una biblioteca a un proyecto, todos los trabajos procesados a través de ese proyecto aplican las entidades de la biblioteca para mejorar la precisión de la extracción del contenido. Ten en cuenta que un proyecto solo se puede asociar a una biblioteca, pero una biblioteca se puede asociar a varios proyectos.
Acceder a la página de la biblioteca de automatización de datos en la consola de BDA
Navegue hasta el servicio Amazon Bedrock.
En el menú de la barra lateral, selecciona «Automatización de datos».
Selecciona «Administrar bibliotecas»
Disponibilidad regional
La biblioteca de automatización de datos está disponible en las siguientes regiones de AWS:
Nombre de la región |
Código de región |
|---|---|
Este de EE. UU. (Norte de Virginia) |
us-east-1 |
Oeste de EE. UU. (Oregón) |
us-west-2 |
Europa (Irlanda) |
eu-west-1 |
Europa (Londres) |
eu-west-2 |
Europa (Fráncfort) |
eu-central-1 |
Asia-Pacífico (Mumbai) |
ap-south-1 |
Asia-Pacífico (Sídney) |
ap-southeast-2 |