Creazione di blueprint per l’estrazione - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di blueprint per l’estrazione

BDA consente di definire i campi di dati specifici che desideri estrarre dai documenti durante la creazione di un blueprint, fornendo così un insieme di istruzioni che indicano a BDA quali informazioni cercare e come interpretarle.

Definizione dei campi

Per iniziare, puoi creare una proprietà per ogni campo che richiede l’estrazione, ad esempio employee_id o product_name. Per ogni campo, è necessario fornire una descrizione, un tipo di dati e un tipo di inferenza.

Per definire un campo per l’estrazione, è necessario specificare i seguenti parametri:

  • Nome del campo: fornisce una spiegazione leggibile dall’essere umano di ciò che il campo rappresenta. Questa descrizione aiuta a comprendere il contesto e lo scopo del campo, favorendo un’estrazione accurata dei dati.

  • Istruzioni: fornisce una spiegazione in linguaggio naturale di ciò che il campo rappresenta. Questa descrizione aiuta a comprendere il contesto e lo scopo del campo, favorendo un’estrazione accurata dei dati.

  • Tipo: specifica il tipo di dati del valore del campo. BDA supporta i seguenti tipi di dati:

    • stringa: per valori basati su testo

    • numero: per valori numerici

    • boolean: per i valori true/false

    • matrice: per campi che possono avere più valori dello stesso tipo (ad esempio, una matrice di stringhe o una matrice di numeri)

  • Tipo di inferenza: indica a BDA come gestire l’estrazione del valore del campo. I tipi di inferenza supportati sono:

    • Esplicito: BDA deve estrarre il valore direttamente dal documento.

    • Dedotto: BDA dovrebbe dedurre il valore in base alle informazioni presenti nel documento.

Di seguito è riportato un esempio di definizione di campo con tutti i parametri:

Console
Console che mostra come aggiungere “Nome del campo” e “Istruzioni”. Il “Tipo” è impostato su “Stringa” e “Tipo di estrazione” è impostato su “Esplicito”.
API
"product_name":{ "type":"string", "inferenceType":"Explicit", "description":"The short name of the product without any extra details" }

In questo esempio:

  • Type è impostato su string, a indicare che il valore del campo product_name deve essere basato su testo.

  • inferenceType è impostato su Explicit e indica a BDA di estrarre il valore direttamente dal documento senza alcuna trasformazione o convalida.

  • L’istruzione fornisce un contesto aggiuntivo, chiarendo che il campo deve contenere il nome breve del prodotto senza ulteriori dettagli.

Specificando questi parametri per ogni campo, BDA dispone delle informazioni necessarie per estrarre dai documenti e interpretare in modo accurato i dati desiderati.

Campo Istruzione Tipo di estrazione Tipo

ApplicantsName

Il nome completo del richiedente

Esplicito

stringa

DateOfBirth

Data di nascita del dipendente

Esplicito

stringa

Sales

Ricavi lordi o vendite

Esplicito

numero

Statement_starting_balance

Saldo all’inizio del periodo

Esplicito

numero

Campi multivalore

Quando un campo può contenere più valori, è possibile definire matrici o tabelle.

Elenco di campi

Per i campi che contengono un elenco di valori, è possibile definire un tipo di dati di matrice.

In questo esempio, "OtherExpenses" è definito come un array di stringhe che consente a BDA di estrarre più voci di spesa per quel campo.

Console
Console che mostra come aggiungere “Nome del campo” e “Istruzioni”. Il “Tipo” è impostato su “Matrice di stringhe” e “Tipo di estrazione” è impostato su “Esplicito”.
API
"OtherExpenses":{ "type":"array", "inferenceType":"Explicit", "description":"Other business expenses not included in fields 8-26 or field 30", "items":{ "type":"string" } }
Tabelle

Se il documento contiene dati tabulari, puoi definire una struttura di tabella all’interno dello schema.

In questo esempio, “SERVICES_TABLE” è definito come un tipo di tabella, con campi di colonna come nome del prodotto, descrizione, quantità, prezzo unitario e importo.

Console
Console che mostra come aggiungere “Nome del campo” e “Istruzioni”. Il “Tipo” è impostato su “Tabella” e il “Tipo di estrazione” è impostato su “Esplicito” e mostra i campi specifici della colonna che vengono aggiunti.
API
"definitions":{ "LINEITEM":{ "properties":{ "quantity":{ "type":"number", "inferenceType":"Explicit" }, "unit price":{ "type":"number", "inferenceType":"Explicit" }, "amount":{ "type":"number", "inferenceType":"Explicit", "description":"Unit Price * Quantity" }, "product name":{ "type":"string", "inferenceType":"Explicit", "description":"The short name of the product without any extra details" }, "product description":{ "type":"string", "inferenceType":"Explicit", "description":"The full item list description text" } } } }, "properties":{ "SERVICES_TABLE":{ "type":"array", "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.", "items":{ "$ref":"#/definitions/LINEITEM" } }, "... ..." ]

Definire schemi completi con descrizioni dei campi, tipi di dati e tipi di inferenza appropriati garantisce che BDA estragga accuratamente le informazioni desiderate dai documenti, indipendentemente dalle variazioni di formattazione o rappresentazione.