Proyectos

Los esquemas son artefactos que puede utilizar para configurar la lógica empresarial de procesamiento de archivos. Cada esquema consta de una lista de nombres de campo que puede extraer, el formato de datos en el que desea que se extraiga la respuesta del campo, como una cadena, un número o un valor booleano, así como el contexto en lenguaje natural de cada campo, que puede usar para especificar las reglas de normalización y validación de datos. Puede crear un esquema para cada clase de archivo que desee procesar, como un W2, un comprobante de pago o una tarjeta de identificación. Los esquemas se pueden crear en la consola o con la API. Cada plano que cree es un AWS recurso con su propio identificador de plano y ARN.

Al utilizar un esquema para la extracción, puede utilizar un esquema del catálogo o un esquema creado de forma personalizada. Si ya sabe el tipo de archivo del que desea extraer información, los esquemas del catálogo proporcionan un punto de partida predefinido. Puede crear esquemas personalizados para los archivos que no están en el catálogo. Al crear un esquema, puede utilizar varios métodos, como generar un esquema mediante un petición de esquema, crearlo manualmente añadiendo campos individuales o creando el JSON de un esquema mediante el editor de JSON. Puede guardar estos esquemas en su cuenta y compartirlos.

nota

Los esquemas de audio no se pueden crear mediante peticiones de esquema.

El tamaño máximo de un esquema es de 100 000 caracteres, con formato JSON. En el caso de los planos que se vayan a utilizar con la InvokeDataAutomationAsyncAPI, el número máximo de campos por plano es de 100. En el caso de los blueprints que se vayan a utilizar con la InvokeDataAutomationAPI, el número máximo de campos por blueprint es de 15.

nota

Al usar esquemas, es posible que utilice peticiones, ya sea en los campos o para la creación de esquemas. Permita que solo fuentes confiables controlen la entrada rápida. Amazon Bedrock no es responsable de validar la intención del plano.

Tutorial de esquema

Tomemos un ejemplo de un documento de identidad, como un pasaporte, y veamos un esquema para este documento.

Ejemplo de pasaporte con campos estándar, que muestra el diseño y los campos de datos que se extraerán.

Este es un ejemplo de esquema para este documento de identidad que creamos en la consola.

Diseño de tabla de las definiciones de los campos del pasaporte, con varias categorías, que muestra un ejemplo de esquema.

Básicamente, un esquema es una estructura de datos que contiene campos que, a su vez, contienen la información extraída por la salida personalizada de BDA. Hay dos tipos de campos, explícitos e implícitos, ubicados en la tabla de extracción. Las extracciones explícitas se utilizan para la información claramente indicada que se puede ver en el documento. Las extracciones implícitas se utilizan para la información que debe transformarse con respecto a la forma en que aparece en el documento. Por ejemplo, puede eliminar los guiones de un número de seguridad social convirtiéndolos de 111-22-3333 a 111223333. Los campos contienen ciertos componentes básicos:

Nombre de campo: es un nombre que puede proporcionar para cada campo que desee extraer del documento. Puede usar el nombre que usa para el campo en su sistema posterior, como Place_Birth o Place_of_birth.
Descripción: se trata de una entrada que proporciona un contexto en lenguaje natural para cada campo del esquema a fin de describir las reglas de normalización o validación de datos que se deben seguir. Por ejemplo, Date of birth in YYYY-MM-DD format o Is the year of birth before 1992?. También puede utilizar la petición como una forma de iterar sobre el esquema y mejorar la precisión de la respuesta de BDA. Proporcionar una petición detallada que describa el campo que necesita ayuda a los modelos subyacentes a mejorar su precisión. Las peticiones pueden tener una longitud de hasta 300 caracteres.
Resultados: la información extraída por BDA en función de la petición y el nombre del campo.
Tipo: el formato de datos que desea que utilice la respuesta del campo. Se admiten cadenas, números, valores booleanos, matrices de cadena y matrices de números.
Puntuación de confianza: el porcentaje de certeza que tiene BDA de que la extracción es precisa. Los planos de audio e imagen no devuelven una puntuación de confianza.
Tipos de extracción: el tipo de extracción, explícita o inferida.
Número de página: página del documento en la que se encontró el resultado. Los esquemas de audio y vídeo no devuelven un número de página.

Además de los campos simples, la salida personalizada de BDA ofrece varias opciones para los casos de uso que puede encontrar en la extracción de documentos: campos de tablas, grupos y tipos personalizados.

Campos de tabla

Al crear un campo, puede elegir crear un campo de tabla en lugar de un campo básico. Puede asignar un nombre al campo y proporcionar una petición, como con los otros campos. También puede proporcionar campos de columna. Estos campos tienen un nombre de columna, una descripción de columna y un tipo de columna. Cuando se muestran en la tabla de extracción, un campo de tabla tiene los resultados de la columna agrupados bajo el nombre de la tabla. Los campos de tabla solo pueden tener un máximo de 15 subcampos.

Groups

Un grupo es una estructura que se utiliza para organizar varios resultados en una sola ubicación dentro de la extracción. Al crear un grupo, se le asigna un nombre, y se pueden crear y colocar campos en ese grupo. Este grupo está marcado en la tabla de extracciones y, debajo de él, se muestran los campos que están dentro del grupo.

Tipos personalizados

Puede crear un tipo personalizado mientras edita un esquema en el sitio de pruebas de esquemas. Cualquier campo puede ser de tipo personalizado. Este tipo tiene un nombre único y solicita la creación de los campos que componen la detección. Un ejemplo sería crear un tipo personalizado denominado Dirección e incluir en él los campos “zip_code”, “city_name”, “street_name” y “state”. Luego, al procesar un documento, podría usar el tipo personalizado en el campo “company_address”. A continuación, ese campo devuelve toda la información, agrupada en filas debajo del tipo personalizado. Puede tener hasta 30 campos de texto personalizados por esquema.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Salida personalizada y esquemas

Creación de esquemas