Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Documenti
L’output standard per i documenti consente di impostare la granularità della risposta desiderata, nonché di stabilire il formato di output e il formato di testo nell’output. Di seguito sono riportati alcuni degli output che è possibile abilitare.
Nota
BDA può elaborare file DOCX. Per elaborare i file DOCX, vengono convertiti in PDFs. Ciò significa che la mappatura dei numeri di pagina non funzionerà per i file DOCX. Le immagini dei file convertiti PDFs verranno caricate nel bucket di output se sono selezionate l'opzione JSON+ e la granularità della pagina.
Granularità della risposta
La granularità della risposta determina il tipo di risposta che si desidera ricevere dall'estrazione del testo del documento. Ogni livello di granularità offre risposte sempre più separate, con una pagina che fornisce tutto il testo estratto insieme e una parola che fornisce ogni parola come risposta separata. I livelli di granularità disponibili sono:
-
Granularità a livello di pagina: questo livello è abilitato per impostazione predefinita. La granularità a livello di pagina fornisce a ogni pagina del documento il formato di output del testo desiderato. Se viene elaborato un PDF, abilitando questo livello di granularità vengono rilevati e restituiti i collegamenti ipertestuali incorporati.
-
Granularità a livello di elemento (layout): questo livello è abilitato per impostazione predefinita. Fornisce il testo del documento nel formato di output desiderato, suddiviso in diversi elementi, come figure, tabelle o paragrafi, restituiti in ordine di lettura logico in base alla struttura del documento. Se viene elaborato un PDF, abilitando questo livello di granularità vengono rilevati e restituiti i collegamenti ipertestuali incorporati.
-
Granularità a livello di parola: fornisce informazioni sulle singole parole senza utilizzare un’analisi di contesto più ampia. Fornisce ogni parola e la relativa posizione nella pagina.
Impostazioni di output
Le impostazioni di output determinano il modo in cui verranno strutturati i risultati scaricati. È possibile definirle esclusivamente della console. Le opzioni per le impostazioni di output sono:
-
JSON: la struttura di output predefinita per l’analisi dei documenti. Fornisce un file di output JSON con le informazioni delle impostazioni di configurazione.
-
API asincrona: InvokeDataAutomationAsyncl'output JSON per l'API Async è solo S3.
-
InvokeDataAutomationAPI di sincronizzazione: l'output JSON può essere impostato su S3 o in linea sfruttando.
outputconfigurationSe è selezionato S3, l'output JSON va solo a S3 (non in linea). Se S3 non è fornito, l'output dell'API Sync supporta solo JSON in linea.
-
-
JSON+files: disponibile solo per l'API Async. InvokeDataAutomationAsync L'utilizzo di questa impostazione genera sia un output JSON che file che corrispondono a output diversi. Ad esempio, questa impostazione offre un file di testo per l’estrazione generale del testo, un file markdown per il testo con markdown strutturale e file CSV per ogni tabella presente nel testo. Vengono salvate anche le figure che si trovano in un documento così come i ritagli di figure e le immagini rettificate. Inoltre, se si sta elaborando un file DOCX ed è selezionata questa opzione, il PDF convertito del file DOCX si troverà nella cartella di output. Questi output si trovano nel percorso
standard_output/della cartella di output.logical_doc_id/assets/
Nota
-
L'API di sincronizzazione non genera alcun file aggiuntivo oltre a JSON. L'output JSON contiene solo il formato di testo selezionato come parte del formato Standard Output Text. L'API di sincronizzazione non produrrà ritagli di figure o immagini rettificate.
-
DocX non è supportato dall'API Sync.
Formato del testo
Il formato del testo determina i diversi tipi di testo che verranno forniti tramite le varie operazioni di estrazione. È possibile selezionare una o più delle seguenti opzioni per il formato del testo.
-
Testo normale: questa impostazione fornisce un output di solo testo senza alcuna formattazione o altri elementi di markdown.
-
Testo con markdown: l’impostazione di output predefinita per l’output standard. Fornisce testo con elementi di markdown integrati.
-
Testo con HTML: fornisce testo con elementi HTML integrati nella risposta.
-
CSV: fornisce un output strutturato in formato CSV per le tabelle presenti nel documento. Questo formato darà una risposta solo per le tabelle e non per altri elementi del documento.
Riquadri di delimitazione e campi generativi
Per i documenti sono disponibili due opzioni di risposta che modificano l’output in base alla granularità selezionata: Riquadri di delimitazione e campi generativi. Se viene selezionato Riquadri di delimitazione, viene visualizzato un contorno visivo dell’elemento selezionato o della parola selezionata nel menu a discesa di risposta della console. In questo modo è possibile rintracciare più facilmente determinati elementi della risposta. I riquadri di delimitazione vengono restituiti nel codice JSON come coordinate dei quattro angoli del riquadro.
Se viene selezionato Campi generativi, viene generato un riepilogo del documento, sia una versione di 10 parole che una di 250 parole. Poi, se vengono selezionati elementi come granularità della risposta, viene generata una didascalia descrittiva di ogni figura rilevata nel documento. Le figure includono elementi come diagrammi, grafici e immagini.
JSON dei metadati per formati di file aggiuntivi
Quando riceverai i file aggiuntivi dal flag dei formati di file aggiuntivi, otterrai un file JSON per tutte le immagini rettificate che vengono estratte. BDA rettifica le immagini ruotate utilizzando un’omografia per ruotare l’immagine con un angolo di 90 gradi. Di seguito è riportato un esempio di JSON:
"asset_metadata": { "rectified_image": "s3://bucket/prefix.png", "rectified_image_width_pixels": 1700, "rectified_image_height_pixels": 2200, "corners": [ [ 0.006980135689736235, -0.061692718505859376 ], [ 1.10847711439684, 0.00673927116394043 ], [ 0.994479346419327, 1.050548828125 ], [ -0.11249661383904497, 0.9942819010416667 ] ] }
Gli angoli rappresentano gli angoli rilevati di un’immagine, utilizzati per formare un’omografia del documento. Questa omografia viene utilizzata per ruotare l’immagine mantenendo le altre proprietà.