Blueprint - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Blueprint

I blueprint sono artefatti che è possibile utilizzare per configurare la logica aziendale di elaborazione dei file. Ogni blueprint è costituito da un elenco di nomi di campo che è possibile estrarre, dal formato di dati in cui estrarre la risposta per il campo, ad esempio stringa, numero o booleano, e dal contesto in linguaggio naturale per ogni campo che è possibile utilizzare per specificare le regole di normalizzazione e convalida dei dati. È possibile creare un blueprint per ogni classe di file da elaborare, ad esempio un W2, una busta paga o una carta di identità. I blueprint possono essere creati utilizzando la console o l’API. Ogni blueprint creato è una AWS risorsa con il proprio ID blueprint e ARN.

Quando viene utilizzato un blueprint per l’estrazione, è possibile utilizzare un blueprint del catalogo o un blueprint personalizzato. Se si conosce già il tipo di file da cui eseguire l’estrazione, i blueprint del catalogo forniscono un punto di partenza predefinito. È possibile creare blueprint personalizzati per file che non sono presenti nel catalogo. Quando viene creato un blueprint, è possibile utilizzare diversi metodi, ad esempio un blueprint generato tramite il prompt del blueprint, la creazione manuale con l’aggiunta di singoli campi o la creazione del codice JSON di un blueprint utilizzando l’editor JSON. I blueprint possono essere salvati nell’account e condivisi.

Nota

I blueprint audio non possono essere creati tramite prompt di blueprint.

La dimensione massima di un blueprint è di 100.000 caratteri in formato JSON. Per i blueprint destinati a essere utilizzati con l'InvokeDataAutomationAsyncAPI, il numero massimo di campi per blueprint è 100. Per i blueprint destinati a essere utilizzati con l'InvokeDataAutomationAPI, il numero massimo di campi per blueprint è 15.

Nota

Con i blueprint potrebbe essere necessario utilizzare i prompt nei campi o per la creazione di blueprint. Consenti solo a fonti attendibili di controllare l'input del prompt. Amazon Bedrocknon è responsabile della convalida dell'intento del blueprint.

Procedura dettagliata per la creazione di un blueprint

Prendiamo un documento di identità, ad esempio come un passaporto, ed esaminiamo nel dettaglio la procedura per la creazione di un blueprint per questo documento.

Esempio di passaporto con campi standard che mostra il layout e i campi dati che verranno estratti.

Ecco un esempio di blueprint per questo documento di identità creato sulla console.

Layout della tabella con le definizioni dei campi del passaporto, e le varie categorie, che mostra un blueprint di esempio.

Fondamentalmente, un blueprint è una struttura di dati contenente campi, che a loro volta contengono le informazioni estratte dall’output personalizzato di BDA. Esistono due tipi di campi, espliciti e impliciti, che si trovano nella tabella di estrazione. Le estrazioni esplicite vengono utilizzate per informazioni chiaramente indicate visualizzabili nel documento. Le estrazioni implicite vengono utilizzate per le informazioni che devono essere trasformate rispetto al modo in cui appaiono nel documento. Ad esempio, è possibile rimuovere i trattini da un numero di previdenza sociale, convertendoli da 111-22-3333 a 111223333. I campi contengono alcuni componenti di base:

  • Nome del campo: il nome che è possibile specificare per ogni campo da estrarre dal documento. È possibile utilizzare il nome in uso per il campo nel sistema downstream, ad esempio Place_Birth o Place_of_birth.

  • Descrizione: un input che fornisce un contesto in linguaggio naturale per ogni campo del blueprint per descrivere le regole di normalizzazione o convalida dei dati da seguire. Ad esempio Date of birth in YYYY-MM-DD format o Is the year of birth before 1992?. È inoltre possibile utilizzare il prompt come metodo per iterare sul blueprint e migliorare l’accuratezza della risposta di BDA. Fornire un prompt dettagliato che descrive il campo richiesto consente di migliorare l’accuratezza dei modelli sottostanti. I prompt possono contenere fino a 300 caratteri.

  • Risultati: le informazioni estratte da BDA in base al prompt e al nome del campo.

  • Tipo: il formato di dati che la risposta deve utilizzare per il campo. I formati supportati sono stringhe, numeri, valori booleani, array di stringhe e array di numeri.

  • Punteggio di attendibilità: la percentuale di certezza di BDA sull’accuratezza dell’estrazione. I blueprint audio non restituiscono un punteggio di attendibilità.

  • Tipi di estrazione: il tipo di estrazione, esplicita o dedotta.

  • Numero di pagina: in quale pagina del documento è stato trovato il risultato. I blueprint audio e video non restituiscono un numero di pagina.

Oltre ai campi semplici, l’output personalizzato di BDA offre diverse opzioni per i casi d’uso riscontrabili nell’estrazione dei documenti: campi della tabella, gruppi e tipi personalizzati.

Campi della tabella

Quando viene creato un campo, è possibile scegliere di creare un campo della tabella anziché un campo di base. È possibile assegnargli un nome e fornire un prompt, come per gli altri campi. È possibile anche specificare campi delle colonne. Questi campi hanno un nome, una descrizione e un tipo di colonna. Quando viene visualizzato nella tabella di estrazione, un campo della tabella contiene i risultati della colonna raggruppati sotto il nome della tabella. I campi della tabella possono contenere al massimo 15 sottocampi.

Gruppi

Un gruppo è una struttura utilizzata per organizzare diversi risultati in un’unica posizione nell’estrazione. Quando viene creato un gruppo, gli viene assegnato un nome ed è possibile creare e inserire campi in quel gruppo. Questo gruppo è contrassegnato nella tabella delle estrazioni, con i campi al suo interno elencati sotto.

Tipi personalizzati

È possibile creare un tipo personalizzato durante la modifica di un blueprint nel playground del blueprint. Qualsiasi campo può essere di tipo personalizzato. Il tipo ha un nome univoco e richiede la creazione dei campi che compongono il rilevamento. Un esempio potrebbe essere la creazione di un tipo personalizzato chiamato Indirizzo, che include i campi “codice_postale”, “nome_città”, “nome_via” e “stato”. Durante l’elaborazione di un documento, è possibile utilizzare il tipo personalizzato in un campo “indirizzo_società”. Quel campo restituisce quindi tutte le informazioni, raggruppate in righe sotto il tipo personalizzato. È possibile avere al massimo 30 campi di tipo personalizzato per blueprint.