Creare blueprint per la normalizzazione - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creare blueprint per la normalizzazione

BDA offre funzionalità di normalizzazione che consentono di convertire e standardizzare i dati estratti in base a requisiti specifici. Queste attività di normalizzazione possono essere classificate in Normalizzazione delle chiavi e Normalizzazione dei valori.

Normalizzazione delle chiavi

In molti casi, i campi del documento possono presentare variazioni nel modo in cui sono rappresentati o etichettati. Ad esempio, il campo “Numero di previdenza sociale” potrebbe apparire come “SSN”, “ID fiscale”, “TIN” o altre varianti simili. Per affrontare questa sfida, BDA offre la normalizzazione delle chiavi, che consente di fornire istruzioni sulle variazioni nelle definizioni dei campi.

Sfruttando la normalizzazione delle chiavi, è possibile consentire a BDA di riconoscere e mappare diverse rappresentazioni dello stesso campo su una chiave standardizzata. Questa funzionalità garantisce che i dati vengano estratti e organizzati in modo coerente, indipendentemente dalle variazioni presenti nei documenti di origine.

Campo Istruzione Tipo di estrazione Tipo

LastName

Cognome della persona

Esplicito

Stringa

BirthNum

Numero del documento o della pratica del certificato di nascita

Esplicito

Stringa

OtherIncome

Altre entrate, inclusi crediti di imposta o rimborsi federali e statali per benzina o carburante

Esplicito

Numero

BusinessName

Nome dell’azienda, dell’appaltatore o dell’entità che compila il W9

Esplicito

Stringa

power factor

Fattore di potenza o moltiplicatore utilizzato per questa voce di utilizzo

Esplicito

Stringa

BirthPlace

Nome dell’ospedale o dell’istituto in cui è nato il bambino

Esplicito

Stringa

Cause of Injury

Causa dell’infortunio o della malattia professionale, compresa la sua attinenza al lavoro

Esplicito

Stringa

Per i campi con set di valori o enumerazioni predefiniti, è possibile fornire i valori o gli intervalli previsti nell’istruzione del campo. Si consiglia di includere le variazioni tra virgolette come mostrato negli esempi.

Campo Istruzione Tipo di estrazione Tipo

LICENSE_CLASS

Codice della classe a lettera singola, a scelta tra “A”, “B” o “C”

Esplicito

Stringa

sex

Sesso, ovvero “M” o “F”

Esplicito

Stringa

InformantType

Tipo di informazioni, a scelta tra “Genitore” o “Altro”

Esplicito

Stringa

INFORMATION COLLECTION CHANNEL

UNO TRA I SEGUENTI: “INTERVISTA DI PERSONA”, “INTERVISTA TELEFONICA”, “FAX O POSTA”, “E-MAIL O INTERNET”

Esplicito

Stringa

Normalizzazione del valore

La normalizzazione del valore è un’attività chiave nelle pipeline di elaborazione dei dati, in cui i dati estratti devono essere trasformati in un formato coerente e standardizzato. Questo processo garantisce che i sistemi a valle possano utilizzare ed elaborare i dati senza interruzioni e senza problemi di compatibilità o ambiguità.

Utilizzando le funzionalità di normalizzazione di BDA, è possibile standardizzare i formati, convertire unità di misura e trasmettere valori in tipi di dati specifici.

Per le attività di normalizzazione dei valori, è necessario utilizzare il tipo di estrazione Dedotta poiché il valore potrebbe non corrispondere esattamente al testo non elaborato o all’OCR del documento dopo la normalizzazione. Ad esempio, un valore di data come “06/25/2022” che richiede di essere formattato come “AAAA-MM-GG” verrà estratto come “2022-06-25” dopo la normalizzazione, quindi non corrisponde all’output OCR del documento.

Formati standardizzati: è possibile convertire i valori in formati predefiniti, come codici abbreviati, schemi di numerazione o formati di data specifici. In questo modo è possibile garantire la coerenza nella rappresentazione dei dati aderendo agli standard di settore o alle convenzioni delle organizzazioni.

Campo Istruzione Tipo di estrazione Tipo

ssn

Il SSN, formattato come XXX-XX-XXX

Dedotta

Stringa

STATE

Codice a due lettere dello stato

Dedotta

Stringa

EXPIRATION_DATE

La data di scadenza nel formato YYYY-MM-DD

Dedotta

Stringa

DATE_OF_BIRTH

La data di nascita del conducente nel formato YYYY-MM-DD

Dedotta

Stringa

CHECK_DATE

Data in cui è stato firmato l’assegno, Riformatta in YYYY-MM-DD

Dedotta

Stringa

PurchaseDate

Data di acquisto del veicolo nel formato mm/dd/yy

Dedotta

Stringa

È possibile anche convertire i valori in un’unità di misura standard o in un tipo di dati specifico gestendo scenari come Non applicabile.

Campo Istruzione Tipo di estrazione Tipo

WEIGHT

Peso convertito in libbre

Dedotta

Numero

HEIGHT

Altezza convertita in pollici

Dedotta

Numero

nonqualified_plans_income

Valore nel campo 11. 0 è N/A.

Dedotta

Numero