Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Proyectos de Automatización de Datos de Bedrock
Una forma de procesar archivos mediante Automatización de Datos de Amazon Bedrock (BDA) es crear un proyecto. Un proyecto es un conjunto de configuraciones de salida estándar y personalizadas. Los proyectos requieren salidas estándar, pero las salidas personalizadas son opcionales. Cuando se llama a la API InvokeDataAutomationAsync con un ARN de proyecto, el archivo se procesa automáticamente con los ajustes de configuración definidos en ese proyecto. A continuación, se genera el resultado en función de la configuración del proyecto.
A un proyecto se le puede asignar una etapa, que puede ser LIVE o DEVELOPMENT. Cada etapa es una versión única y mutable del proyecto. Esto significa que puede editar o probar con la etapa DEVELOPMENT y procesar las solicitudes de los clientes utilizando la etapa LIVE. No se puede acceder a los proyectos de DEVELOPMENT desde la consola, y se deben cambiar e invocar a través de la API.
Un proyecto le permite usar un único recurso para varios tipos de archivos. Por ejemplo, un archivo de audio enviado a BDA con el nombre de proyecto ABC se procesará utilizando la configuración de salida de audio estándar del proyecto ABC. Un documento enviado a BDA con el nombre de proyecto ABC se procesará utilizando la configuración de salida de documento estándar de ABC.
Los proyectos le ofrecen una mayor flexibilidad a la hora de configurar la salida estándar. Cada salida estándar tiene su propio conjunto de opciones configurables, como transcripciones o resúmenes, y los proyectos le permiten cambiar esas opciones para adaptarlas mejor a su caso de uso. También puede configurar un proyecto con esquemas de documentos, audio e imágenes para definir una salida personalizada. Un proyecto configurado para generar una salida personalizada también generará una salida estándar automáticamente.
En las siguientes secciones veremos algunos ejemplos del uso de proyectos.
Uso de proyectos con salida estándar
Consideremos un caso de uso en el que solo le interesa extraer resúmenes de las transcripciones de sus archivos de audio y vídeo completos. De forma predeterminada, cuando envía archivos de audio y vídeo a BDA, recibe los resúmenes de las transcripciones junto con las transcripciones completas, los resúmenes de nivel de escena, el texto detectado y otra información. En este caso de uso, no querrá dedicar tiempo y recursos adicionales a recopilar información que no necesita. Para este caso de uso, puede configurar un proyecto de salida estándar para habilitar solo la característica de resumen para los archivos de audio y vídeo.
Para ello, utilice la API o la consola, cree un proyecto y modifique la configuración de salida estándar para audio y vídeo. En el caso del vídeo, active Resumen completo del vídeo, pero asegúrese de que las demás extracciones (por ejemplo, la transcripción completa del audio, los resúmenes de escenas, la moderación del contenido, etc.) estén desactivadas. Repita esta configuración para el audio. Tras configurar el proyecto para que solo genere resúmenes, guárdelo y anote los nombres de los recursos de Amazon (ARN) del proyecto. Este ARN se puede utilizar para la operación InvokeDataAutomationAsync para procesar los archivos a escala. Al pasar un archivo de audio o vídeo a BDA y especificar el ARN de este proyecto, recibirá una salida únicamente de los resúmenes de cada uno de los archivos. Tenga en cuenta que en este ejemplo no se realizó ninguna configuración para los documentos o las imágenes. Esto significa que si pasa una imagen o un documento a BDA con el ARN de ese proyecto, recibirá la salida estándar predeterminada para esos archivos.
Uso de proyectos con salida personalizada y salida estándar
Para este caso de uso, vamos a suponer que desea generar resúmenes de salida estándar para documentos y archivos de audio, y también extraer campos personalizados de sus documentos. Después de crear un proyecto, configure la salida de audio estándar para activar Resumen completo de audio y asegúrese de que no estén habilitadas otras extracciones. Repita esta configuración de salida estándar para los documentos. A continuación, puede configurar la salida personalizada de los documentos añadiendo un esquema nuevo o uno preexistente del catálogo global de BDA. Los documentos que se pasen a BDA mediante el ARN de este proyecto generarán la salida estándar, los resúmenes completos de los documentos y la salida del esquema para los campos personalizados definidos. Los archivos de audio que se pasen a BDA mediante el ARN de este proyecto generarán resúmenes completos.
Al procesar documentos, es posible que desee utilizar varios esquemas para los distintos tipos de documentos que se pasen al proyecto. Un proyecto puede tener hasta 40 esquemas de documentos adjuntos. BDA compara automáticamente los documentos con el esquema correspondiente que esté configurado en el proyecto y genera una salida personalizada a partir de ese esquema. Además, es posible que desee pasar los documentos en bloque. Si pasa un archivo que contiene varios documentos, puede elegir dividir el documento al crear el proyecto. Si decide hacerlo, BDA analiza el archivo y lo divide en documentos individuales según el contexto. A continuación, esos documentos individuales se comparan con el esquema correcto para su procesamiento.
Actualmente, las imágenes solo admiten una única definición de esquema por proyecto. Los tipos de archivos de imagen JPG y PNG pueden tratarse como imágenes o documentos escaneados en función de su contenido. Se recomienda crear un esquema personalizado para las imágenes cuando procese la salida personalizada de los documentos, de modo que BDA proporcione la salida deseada para los archivos de imagen que contienen texto.
Los archivos de audio también admiten una única definición de esquema por proyecto.