

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Ingressi per analisi personalizzate in tempo reale
<a name="idp-inputs-sync"></a>

L'analisi in tempo reale utilizzando modelli personalizzati richiede un singolo documento come input. I seguenti argomenti descrivono i tipi di documenti di input che è possibile utilizzare.

**Topics**
+ [Documenti in testo semplice](#idp-inputs-sync-text)
+ [Documenti semistrutturati](#idp-inputs-sync-semi)
+ [File di immagine e file PDF scansionati](#idp-inputs-sync-ocr)
+ [Output di Amazon Textract](#idp-inputs-sync-textract)
+ [Dimensioni massime dei documenti per l'analisi in tempo reale](#idp-inputs-sync-sizes)
+ [Errori nei documenti semistrutturati](#idp-inputs-sync-err)

## Documenti in testo semplice
<a name="idp-inputs-sync-text"></a>

Fornisci il documento di input come testo in formato UTF-8. 

## Documenti semistrutturati
<a name="idp-inputs-sync-semi"></a>

I documenti semistrutturati includono documenti PDF nativi e documenti Word. 

Per impostazione predefinita, l'analisi personalizzata in tempo reale utilizza il parser Amazon Comprehend per estrarre il testo da file Word e file PDF digitali. Per i file PDF, puoi ignorare questa impostazione predefinita e utilizzare Amazon Textract per estrarre il testo. Per informazioni, consulta [Impostazione delle opzioni di estrazione del testo](idp-set-textract-options.md).

## File di immagine e file PDF scansionati
<a name="idp-inputs-sync-ocr"></a>

I tipi di immagini supportati includono JPEG, PNG e TIFF.

Per impostazione predefinita, il riconoscimento personalizzato delle entità utilizza l'operazione `DetectDocumentText` API Amazon Textract per estrarre il testo dai file di immagine e dai file PDF scansionati. Puoi sovrascrivere questa impostazione predefinita per utilizzare invece l'operazione `AnalyzeDocument` API. Per informazioni, consulta [Impostazione delle opzioni di estrazione del testo](idp-set-textract-options.md).

## Output di Amazon Textract
<a name="idp-inputs-sync-textract"></a>

Puoi fornire l'output JSON dell'API `AnalyzeDocument` o dell'API Amazon `DetectDocumentText` Textract come input per le operazioni API in tempo reale per la classificazione personalizzata e il riconoscimento personalizzato delle entità. Amazon Comprehend supporta questo tipo di input per le operazioni API in tempo reale, ma non per la console.

## Dimensioni massime dei documenti per l'analisi in tempo reale
<a name="idp-inputs-sync-sizes"></a>

Per tutti i tipi di documenti di input, il file di input può contenere al massimo una pagina, con non più di 10.000 caratteri.

La tabella seguente mostra le dimensioni massime dei file per i documenti di input. 


| Tipo di file | Dimensione massima (API) | Dimensione massima (console) | 
| --- | --- | --- | 
| Documenti di testo UTF-8 | 10 KB | 10 KB | 
| Documenti PDF | 10 MB | 5 MB | 
| Documenti Word | 10 MB | 1 MB | 
| File di immagine | 10 MB | 5 MB | 
| Textract dei file di output | 1 MB | N/A | 

## Errori nei documenti semistrutturati
<a name="idp-inputs-sync-err"></a>

 L'operazione [ClassifyDocument](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ClassifyDocument.html)o [DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)API può riscontrare errori a livello di documento o a livello di pagina durante l'estrazione del testo da un documento semistrutturato o da un file di immagine.

### Errori a livello di pagina
<a name="idp-inputs-sync-page-err"></a>

 Se l'operazione [ClassifyDocument](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ClassifyDocument.html)o l'[DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)API rileva errori durante l'elaborazione di una pagina nel documento di input, la risposta API include una voce nell'[elenco Errori](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ErrorsListItem.html) per ogni errore.

La voce `ErrorCode` nell'elenco degli errori contiene uno dei seguenti valori:
+ TEXTRACT\$1BAD\$1PAGE — Amazon Textract non è in grado di leggere la pagina. Per ulteriori informazioni sui limiti di pagina in Amazon Textract, consulta [Quotazioni di pagina in Amazon Textract](https://docs.aws.amazon.com/textract/latest/dg/limits-document.html).
+ TEXTRACT\$1PROVISIONED\$1THROUGHPUT\$1EXCEEDED — Il numero di richieste ha superato il limite di velocità effettiva. Per ulteriori informazioni sulle quote di velocità effettiva in Amazon Textract, [consulta Quote predefinite in](https://docs.aws.amazon.com/textract/latest/dg/limits-quotas-explained.html) Amazon Textract.
+ PAGE\$1CHARACTERS\$1EXCEEDED — Troppi caratteri di testo nella pagina (massimo 10.000 caratteri).
+ PAGE\$1SIZE\$1EXCEEDED: la dimensione massima della pagina è 10 MB.
+ INTERNAL\$1SERVER\$1ERROR — La richiesta ha rilevato un problema di servizio. Prova di nuovo la richiesta API.

### Errori a livello di documento
<a name="idp-inputs-sync-doc-err"></a>

Se l'operazione [ClassifyDocument](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ClassifyDocument.html)o l'[DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)API rileva un errore a livello di documento nel documento di input, l'API restituisce una risposta di errore. `InvalidRequestException` 

Nella risposta all'errore, il **Reason** campo contiene il valore. `INVALID_DOCUMENT` 

Il **Detail** campo contiene uno dei seguenti valori:
+ DOCUMENT\$1SIZE\$1EXCEEDED — La dimensione del documento è troppo grande. Controlla le dimensioni del file e invia nuovamente la richiesta.
+ UNSUPPORTED\$1DOC\$1TYPE — Il tipo di documento non è supportato. Controlla il tipo di file e invia nuovamente la richiesta.
+ PAGE\$1LIMIT\$1EXCEEDED — Troppe pagine nel documento. Controlla il numero di pagine del file e invia nuovamente la richiesta.
+ TEXTRACT\$1ACCESS\$1DENIED\$1EXCEPTION — Accesso negato ad Amazon Textract. Verifica che il tuo account sia autorizzato a utilizzare le operazioni Amazon Textract [DetectDocumentText](https://docs.aws.amazon.com/textract/latest/dg/API_DetectDocumentText.html)e [AnalyzeDocument](https://docs.aws.amazon.com/textract/latest/dg/API_AnalyzeDocument.html)API e invia nuovamente la richiesta.