

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de esquemas para extracción
<a name="idp-cases-extraction"></a>

BDA le permite definir los campos de datos específicos que desea extraer de sus documentos mediante la creación de un esquema. Actúa como un conjunto de instrucciones que guían a BDA sobre qué información buscar y cómo interpretarla.

**Definición de campos**  
Para empezar, puede crear una propiedad para cada campo que deba extraerse, como employee\$1id o product\$1name. Para cada campo, debe proporcionar una descripción, un tipo de datos y un tipo de inferencia.

Para definir un campo para su extracción, debe especificar los siguientes parámetros:
+ Nombre del campo: proporciona una explicación legible para los humanos de lo que representa el campo. Esta descripción ayuda a comprender el contexto y el propósito del campo, lo que contribuye a la extracción precisa de los datos.
+ Instrucción: proporciona una explicación en lenguaje natural de lo que representa el campo. Esta descripción ayuda a comprender el contexto y el propósito del campo, lo que contribuye a la extracción precisa de los datos.
+ Tipo: especifica el tipo de datos del valor del campo. BDA admite los siguientes tipos de datos:
  + cadena: para valores basados en texto
  + número: para valores numéricos
  + boolean: Para valores true/false 
  + matriz: para campos que pueden tener varios valores del mismo tipo (por ejemplo, una matriz de cadenas o una matriz de números)
+ Tipo de inferencia: indica a BDA cómo tratar la extracción del valor del campo. Los tipos de inferencia admitidos son:
  + Explícita: BDA debe extraer el valor directamente del documento.
  + Inferida: BDA debe deducir el valor en función de la información presente en el documento.

A continuación se incluye un ejemplo de definición de campos con todos los parámetros:

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Cadena” y el “Tipo de extracción” se establece en “Explícita”.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

En este ejemplo:
+ El tipo se establece en una cadena, lo que indica que el valor del campo product\$1type debe estar basado en texto.
+ inferenceType está establecido en Explícito, lo que indica a BDA que extraiga el valor directamente del documento sin ninguna transformación ni validación.
+ La instrucción proporciona un contexto adicional y aclara que el campo debe contener el nombre abreviado del producto sin ningún detalle adicional.

Al especificar estos parámetros para cada campo, proporciona a BDA la información necesaria para extraer e interpretar los datos deseados de forma precisa de sus documentos.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  Nombre completo del solicitante  |  Explícita  |  cadena  | 
|  DateOfBirth  |  Fecha de nacimiento del empleado  |  Explícita  |  cadena  | 
|  Ventas  |  Ingresos o ventas brutos  |  Explícita  |  número  | 
|  Statement\$1starting\$1balance  |  Saldo al inicio del período  |  Explícita  |  número  | 

**Campos de varios valores**  
En los casos en que un campo pueda contener varios valores, puede definir matrices o tablas.

**Lista de campos**  
Para los campos que contienen una lista de valores, puede definir un tipo de datos de matriz. 

En este ejemplo, «OtherExpenses» se define como una matriz de cadenas que permite a BDA extraer varias partidas de gastos para ese campo.

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Matriz de cadenas” y el “Tipo de extracción” se establece en “Explícita”.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**Tablas**  
Si el documento contiene datos tabulares, puede definir una estructura de tabla dentro del esquema.

En este ejemplo, “SERVICES\$1TABLE” se define como un tipo de tabla, con campos de columnas como el nombre del producto, la descripción, la cantidad, el precio unitario y el importe.

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Tabla” y el “Tipo de extracción” se establece en “Explícita”, y muestra los campos específicos de la columna que se añaden.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

Al definir esquemas completos con las descripciones de campo, los tipos de datos y los tipos de inferencia adecuados, puede asegurarse de que BDA extraiga con precisión la información deseada de sus documentos, independientemente de las variaciones en el formato o la representación.