Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di blueprint per l’estrazione
BDA consente di definire i campi di dati specifici che desideri estrarre dai documenti durante la creazione di un blueprint, fornendo così un insieme di istruzioni che indicano a BDA quali informazioni cercare e come interpretarle.
Definizione dei campi
Per iniziare, puoi creare una proprietà per ogni campo che richiede l’estrazione, ad esempio employee_id o product_name. Per ogni campo, è necessario fornire una descrizione, un tipo di dati e un tipo di inferenza.
Per definire un campo per l’estrazione, è necessario specificare i seguenti parametri:
-
Nome del campo: fornisce una spiegazione leggibile dall’essere umano di ciò che il campo rappresenta. Questa descrizione aiuta a comprendere il contesto e lo scopo del campo, favorendo un’estrazione accurata dei dati.
-
Istruzioni: fornisce una spiegazione in linguaggio naturale di ciò che il campo rappresenta. Questa descrizione aiuta a comprendere il contesto e lo scopo del campo, favorendo un’estrazione accurata dei dati.
-
Tipo: specifica il tipo di dati del valore del campo. BDA supporta i seguenti tipi di dati:
-
stringa: per valori basati su testo
-
numero: per valori numerici
-
boolean: per i valori true/false
-
matrice: per campi che possono avere più valori dello stesso tipo (ad esempio, una matrice di stringhe o una matrice di numeri)
-
-
Tipo di inferenza: indica a BDA come gestire l’estrazione del valore del campo. I tipi di inferenza supportati sono:
-
Esplicito: BDA deve estrarre il valore direttamente dal documento.
-
Dedotto: BDA dovrebbe dedurre il valore in base alle informazioni presenti nel documento.
-
Di seguito è riportato un esempio di definizione di campo con tutti i parametri:
In questo esempio:
-
Type è impostato su string, a indicare che il valore del campo product_name deve essere basato su testo.
-
inferenceType è impostato su Explicit e indica a BDA di estrarre il valore direttamente dal documento senza alcuna trasformazione o convalida.
-
L’istruzione fornisce un contesto aggiuntivo, chiarendo che il campo deve contenere il nome breve del prodotto senza ulteriori dettagli.
Specificando questi parametri per ogni campo, BDA dispone delle informazioni necessarie per estrarre dai documenti e interpretare in modo accurato i dati desiderati.
| Campo | Istruzione | Tipo di estrazione | Tipo |
|---|---|---|---|
|
ApplicantsName |
Il nome completo del richiedente |
Esplicito |
stringa |
|
DateOfBirth |
Data di nascita del dipendente |
Esplicito |
stringa |
|
Sales |
Ricavi lordi o vendite |
Esplicito |
numero |
|
Statement_starting_balance |
Saldo all’inizio del periodo |
Esplicito |
numero |
Campi multivalore
Quando un campo può contenere più valori, è possibile definire matrici o tabelle.
Elenco di campi
Per i campi che contengono un elenco di valori, è possibile definire un tipo di dati di matrice.
In questo esempio, "OtherExpenses" è definito come un array di stringhe che consente a BDA di estrarre più voci di spesa per quel campo.
Tabelle
Se il documento contiene dati tabulari, puoi definire una struttura di tabella all’interno dello schema.
In questo esempio, “SERVICES_TABLE” è definito come un tipo di tabella, con campi di colonna come nome del prodotto, descrizione, quantità, prezzo unitario e importo.
Definire schemi completi con descrizioni dei campi, tipi di dati e tipi di inferenza appropriati garantisce che BDA estragga accuratamente le informazioni desiderate dai documenti, indipendentemente dalle variazioni di formattazione o rappresentazione.