Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creare blueprint per la normalizzazione
BDA offre funzionalità di normalizzazione che consentono di convertire e standardizzare i dati estratti in base a requisiti specifici. Queste attività di normalizzazione possono essere classificate in Normalizzazione delle chiavi e Normalizzazione dei valori.
Normalizzazione delle chiavi
In molti casi, i campi del documento possono presentare variazioni nel modo in cui sono rappresentati o etichettati. Ad esempio, il campo “Numero di previdenza sociale” potrebbe apparire come “SSN”, “ID fiscale”, “TIN” o altre varianti simili. Per affrontare questa sfida, BDA offre la normalizzazione delle chiavi, che consente di fornire istruzioni sulle variazioni nelle definizioni dei campi.
Sfruttando la normalizzazione delle chiavi, è possibile consentire a BDA di riconoscere e mappare diverse rappresentazioni dello stesso campo su una chiave standardizzata. Questa funzionalità garantisce che i dati vengano estratti e organizzati in modo coerente, indipendentemente dalle variazioni presenti nei documenti di origine.
| Campo | Istruzione | Tipo di estrazione | Tipo |
|---|---|---|---|
|
LastName |
Cognome della persona |
Esplicito |
Stringa |
|
BirthNum |
Numero del documento o della pratica del certificato di nascita |
Esplicito |
Stringa |
|
OtherIncome |
Altre entrate, inclusi crediti di imposta o rimborsi federali e statali per benzina o carburante |
Esplicito |
Numero |
|
BusinessName |
Nome dell’azienda, dell’appaltatore o dell’entità che compila il W9 |
Esplicito |
Stringa |
|
power factor |
Fattore di potenza o moltiplicatore utilizzato per questa voce di utilizzo |
Esplicito |
Stringa |
|
BirthPlace |
Nome dell’ospedale o dell’istituto in cui è nato il bambino |
Esplicito |
Stringa |
|
Cause of Injury |
Causa dell’infortunio o della malattia professionale, compresa la sua attinenza al lavoro |
Esplicito |
Stringa |
Per i campi con set di valori o enumerazioni predefiniti, è possibile fornire i valori o gli intervalli previsti nell’istruzione del campo. Si consiglia di includere le variazioni tra virgolette come mostrato negli esempi.
| Campo | Istruzione | Tipo di estrazione | Tipo |
|---|---|---|---|
|
LICENSE_CLASS |
Codice della classe a lettera singola, a scelta tra “A”, “B” o “C” |
Esplicito |
Stringa |
|
sex |
Sesso, ovvero “M” o “F” |
Esplicito |
Stringa |
|
InformantType |
Tipo di informazioni, a scelta tra “Genitore” o “Altro” |
Esplicito |
Stringa |
|
INFORMATION COLLECTION CHANNEL |
UNO TRA I SEGUENTI: “INTERVISTA DI PERSONA”, “INTERVISTA TELEFONICA”, “FAX O POSTA”, “E-MAIL O INTERNET” |
Esplicito |
Stringa |
Normalizzazione del valore
La normalizzazione del valore è un’attività chiave nelle pipeline di elaborazione dei dati, in cui i dati estratti devono essere trasformati in un formato coerente e standardizzato. Questo processo garantisce che i sistemi a valle possano utilizzare ed elaborare i dati senza interruzioni e senza problemi di compatibilità o ambiguità.
Utilizzando le funzionalità di normalizzazione di BDA, è possibile standardizzare i formati, convertire unità di misura e trasmettere valori in tipi di dati specifici.
Per le attività di normalizzazione dei valori, è necessario utilizzare il tipo di estrazione Dedotta poiché il valore potrebbe non corrispondere esattamente al testo non elaborato o all’OCR del documento dopo la normalizzazione. Ad esempio, un valore di data come “06/25/2022” che richiede di essere formattato come “AAAA-MM-GG” verrà estratto come “2022-06-25” dopo la normalizzazione, quindi non corrisponde all’output OCR del documento.
Formati standardizzati: è possibile convertire i valori in formati predefiniti, come codici abbreviati, schemi di numerazione o formati di data specifici. In questo modo è possibile garantire la coerenza nella rappresentazione dei dati aderendo agli standard di settore o alle convenzioni delle organizzazioni.
| Campo | Istruzione | Tipo di estrazione | Tipo |
|---|---|---|---|
|
ssn |
Il SSN, formattato come XXX-XX-XXX |
Dedotta |
Stringa |
|
STATE |
Codice a due lettere dello stato |
Dedotta |
Stringa |
|
EXPIRATION_DATE |
La data di scadenza nel formato YYYY-MM-DD |
Dedotta |
Stringa |
|
DATE_OF_BIRTH |
La data di nascita del conducente nel formato YYYY-MM-DD |
Dedotta |
Stringa |
|
CHECK_DATE |
Data in cui è stato firmato l’assegno, Riformatta in YYYY-MM-DD |
Dedotta |
Stringa |
|
PurchaseDate |
Data di acquisto del veicolo nel formato mm/dd/yy |
Dedotta |
Stringa |
È possibile anche convertire i valori in un’unità di misura standard o in un tipo di dati specifico gestendo scenari come Non applicabile.
| Campo | Istruzione | Tipo di estrazione | Tipo |
|---|---|---|---|
|
WEIGHT |
Peso convertito in libbre |
Dedotta |
Numero |
|
HEIGHT |
Altezza convertita in pollici |
Dedotta |
Numero |
|
nonqualified_plans_income |
Valore nel campo 11. 0 è N/A. |
Dedotta |
Numero |