

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Creare blueprint per la normalizzazione
<a name="idp-cases-normalization"></a>

BDA offre funzionalità di normalizzazione che consentono di convertire e standardizzare i dati estratti in base a requisiti specifici. Queste attività di normalizzazione possono essere classificate in Normalizzazione delle chiavi e Normalizzazione dei valori.

**Normalizzazione delle chiavi**  
In molti casi, i campi del documento possono presentare variazioni nel modo in cui sono rappresentati o etichettati. Ad esempio, il campo “Numero di previdenza sociale” potrebbe apparire come “SSN”, “ID fiscale”, “TIN” o altre varianti simili. Per affrontare questa sfida, BDA offre la normalizzazione delle chiavi, che consente di fornire istruzioni sulle variazioni nelle definizioni dei campi.

Sfruttando la normalizzazione delle chiavi, è possibile consentire a BDA di riconoscere e mappare diverse rappresentazioni dello stesso campo su una chiave standardizzata. Questa funzionalità garantisce che i dati vengano estratti e organizzati in modo coerente, indipendentemente dalle variazioni presenti nei documenti di origine.


| Campo | Istruzione | Tipo di estrazione | Tipo | 
| --- | --- | --- | --- | 
|  LastName  |  Cognome della persona  |  Esplicito  |  Stringa  | 
|  BirthNum  |  Numero del documento o della pratica del certificato di nascita  |  Esplicito  |  Stringa  | 
|  OtherIncome  |  Altre entrate, inclusi crediti di imposta o rimborsi federali e statali per benzina o carburante  |  Esplicito  |  Numero  | 
|  BusinessName  |  Nome dell’azienda, dell’appaltatore o dell’entità che compila il W9  |  Esplicito  |  Stringa  | 
|  power factor  |  Fattore di potenza o moltiplicatore utilizzato per questa voce di utilizzo  |  Esplicito  |  Stringa  | 
|  BirthPlace  |  Nome dell’ospedale o dell’istituto in cui è nato il bambino  |  Esplicito  |  Stringa  | 
|  Cause of Injury  |  Causa dell’infortunio o della malattia professionale, compresa la sua attinenza al lavoro  |  Esplicito  |  Stringa  | 

Per i campi con set di valori o enumerazioni predefiniti, è possibile fornire i valori o gli intervalli previsti nell’istruzione del campo. Si consiglia di includere le variazioni tra virgolette come mostrato negli esempi.


| Campo | Istruzione | Tipo di estrazione | Tipo | 
| --- | --- | --- | --- | 
|  LICENSE\$1CLASS  |  Codice della classe a lettera singola, a scelta tra “A”, “B” o “C”  |  Esplicito  |  Stringa  | 
|  sex  |  Sesso, ovvero “M” o “F”  |  Esplicito  |  Stringa  | 
|  InformantType  |  Tipo di informazioni, a scelta tra “Genitore” o “Altro”  |  Esplicito  |  Stringa  | 
|  INFORMATION COLLECTION CHANNEL  |  UNO TRA I SEGUENTI: “INTERVISTA DI PERSONA”, “INTERVISTA TELEFONICA”, “FAX O POSTA”, “E-MAIL O INTERNET”  |  Esplicito  |  Stringa  | 

**Normalizzazione del valore**  
La normalizzazione del valore è un’attività chiave nelle pipeline di elaborazione dei dati, in cui i dati estratti devono essere trasformati in un formato coerente e standardizzato. Questo processo garantisce che i sistemi a valle possano utilizzare ed elaborare i dati senza interruzioni e senza problemi di compatibilità o ambiguità.

Utilizzando le funzionalità di normalizzazione di BDA, è possibile standardizzare i formati, convertire unità di misura e trasmettere valori in tipi di dati specifici.

Per le attività di normalizzazione dei valori, è necessario utilizzare il tipo di estrazione Dedotta poiché il valore potrebbe non corrispondere esattamente al testo non elaborato o all’OCR del documento dopo la normalizzazione. Ad esempio, un valore di data come “06/25/2022” che richiede di essere formattato come “AAAA-MM-GG” verrà estratto come “2022-06-25” dopo la normalizzazione, quindi non corrisponde all’output OCR del documento.

Formati standardizzati: è possibile convertire i valori in formati predefiniti, come codici abbreviati, schemi di numerazione o formati di data specifici. In questo modo è possibile garantire la coerenza nella rappresentazione dei dati aderendo agli standard di settore o alle convenzioni delle organizzazioni.


| Campo | Istruzione | Tipo di estrazione | Tipo | 
| --- | --- | --- | --- | 
|  ssn  |  Il SSN, formattato come XXX-XX-XXX  |  Dedotta  |  Stringa  | 
|  STATE  |  Codice a due lettere dello stato  |  Dedotta  |  Stringa  | 
|  EXPIRATION\$1DATE  |  La data di scadenza nel formato YYYY-MM-DD  |  Dedotta  |  Stringa  | 
|  DATE\$1OF\$1BIRTH  |  La data di nascita del conducente nel formato YYYY-MM-DD  |  Dedotta  |  Stringa  | 
|  CHECK\$1DATE  |  Data in cui è stato firmato l’assegno, Riformatta in YYYY-MM-DD  |  Dedotta  |  Stringa  | 
|  PurchaseDate  |  Data di acquisto del veicolo nel formato mm/dd/yy  |  Dedotta  |  Stringa  | 

È possibile anche convertire i valori in un’unità di misura standard o in un tipo di dati specifico gestendo scenari come Non applicabile.


| Campo | Istruzione | Tipo di estrazione | Tipo | 
| --- | --- | --- | --- | 
|  WEIGHT  |  Peso convertito in libbre  |  Dedotta  |  Numero  | 
|  HEIGHT  |  Altezza convertita in pollici  |  Dedotta  |  Numero  | 
|  nonqualified\$1plans\$1income  |  Valore nel campo 11. 0 è N/A.  |  Dedotta  |  Numero  | 