View a markdown version of this page

Prerequisiti per l’utilizzo di Bedrock Data Automation - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prerequisiti per l’utilizzo di Bedrock Data Automation

I file per BDA devono soddisfare determinati requisiti per essere elaborati. Le tabelle seguenti mostrano quali sono i requisiti in base ai vari tipi di file.

Async

Requisiti per i file di documenti asincroni

Le tabelle seguenti mostrano i requisiti per i file elaborati utilizzando l'API Async di Invoke Data Automation.

Requisiti dei file di documento

Descrizione del requisito

Dettagli del requisito

(Console) Numero massimo di pagine per file di documento

20

Numero massimo di pagine per documento quando la suddivisione è abilitata

3000

(Console) Dimensione massima del file (MB)

200

Dimensione massima del file (MB)

500

Formati file supportati

PDF, TIFF, JPEG, PNG, DOCX

Limiti specifici del PDF

L'altezza e la larghezza massime sono 40 pollici e 9000 punti. PDFs non può essere protetto da password. PDFs può contenere immagini in formato JPEG 2000.

Rotazione del documento e dimensione dell’immagine

BDA supporta tutte le rotazioni in piano dei documenti, ad esempio una rotazione in piano di 45 gradi.

BDA supporta immagini con una risoluzione inferiore o uguale a 10.000 pixel su tutti i lati.

Allineamento del testo

Il testo può essere allineato orizzontalmente all’interno del documento. Il testo disposto orizzontalmente può essere letto indipendentemente dal grado di rotazione del documento. BDA non supporta l’allineamento verticale del testo (testo scritto verticalmente, come è comune in lingue come il giapponese e il cinese) all’interno del documento.

Dimensione del carattere

L’altezza minima per il testo da rilevare è di 15 pixel. A 150 DPI, questo equivale a un carattere da 8 punti.

Tipi di carattere

BDA supporta il riconoscimento dei caratteri scritti a mano e stampati.

Nota

Per elaborare i file DOCX, vengono convertiti in. PDFs Ciò significa che la mappatura dei numeri di pagina non funzionerà per i file DOCX. Le immagini dei file convertiti PDFs verranno caricate nel bucket di output se sono selezionate l'opzione JSON+ e la granularità della pagina.

L'ottimizzazione delle istruzioni Blueprint supporta tutti i limiti sopra indicati per i documenti con le seguenti differenze:

  • Un totale di 10 esempi di risorse documentali

  • 20 pagine per documento (esempio di risorse) su console e API

  • 200 MB per l'esempio di risorsa documentale totale

  • Solo formati di file di documenti PDF, DOCX e TIFF

Sync

Sincronizza i requisiti relativi ai file

Le tabelle seguenti mostrano i requisiti per i file elaborati utilizzando l'API Invoke Data Automation.

Requisiti dei file di documento

Descrizione del requisito

Dettagli del requisito

(Console) Numero massimo di pagine per file di documento

10

Numero massimo di pagine per file di documento (lo splitter non è disponibile)

10

(Console) Dimensione massima del file (MB)

50

Dimensione massima del file (MB)

50

Formati file supportati

PDF, TIFF, JPEG, PNG

Limiti specifici del PDF

L'altezza e la larghezza massime sono 40 pollici e 9000 punti. PDFs non può essere protetto da password. PDFs può contenere immagini in formato JPEG 2000.

Rotazione del documento e dimensione dell’immagine

BDA supporta tutte le rotazioni in piano dei documenti, ad esempio una rotazione in piano di 45 gradi.

BDA supporta immagini con una risoluzione inferiore o uguale a 10.000 pixel su tutti i lati.

Allineamento del testo

Il testo può essere allineato orizzontalmente all’interno del documento. Il testo disposto orizzontalmente può essere letto indipendentemente dal grado di rotazione del documento. BDA non supporta l’allineamento verticale del testo (testo scritto verticalmente, come è comune in lingue come il giapponese e il cinese) all’interno del documento.

Dimensione del carattere

L’altezza minima per il testo da rilevare è di 15 pixel. A 150 DPI, questo equivale a un carattere da 8 punti.

Tipi di carattere

BDA supporta il riconoscimento dei caratteri scritti a mano e stampati.

Nota

I sottotitoli delle figure funzionano su 20 immagini per documento da 10 pagine (sincronizzato) e 20 immagini per pagina (asincrono).

Suggerimento

Suggerimenti per velocizzare l'elaborazione delle API di sincronizzazione:

  • Disabilita i campi generativi a meno che non sia assolutamente necessario.

  • Seleziona solo la granularità e il formato di output del testo di cui hai bisogno (anziché selezionarne più di uno).

  • Semplifica il tuo Blueprint per ridurre il più possibile il numero di campi estratti.

  • Riduci il numero di campi di tabella ed elenco nel tuo blueprint, ove possibile.

Requisiti del progetto

Descrizione del requisito

Dettagli del requisito

Numero massimo di progetti per progetto

40

Numero massimo di progetti per account

100

Numero massimo di progetti per account

1000

Numero massimo di versioni del blueprint

100

Numero massimo di campi fogliari del blueprint

100

Numero massimo di campi foglia dell'elenco dei progetti

30

Lunghezza massima del nome del progetto

60 caratteri

Lunghezza massima della descrizione del campo del blueprint

600 caratteri (documento), 500 caratteri () image/video/audio

Lunghezza massima del nome del campo del blueprint

60 caratteri

Dimensione massima del progetto

100.000 caratteri (in formato JSON)

Requisiti dei file immagine

Descrizione del requisito

Dettagli del requisito

Dimensione massima del file (MB)

5

Risoluzione massima

8.000

Formati file supportati

JPG, PNG

Requisiti per i file video

Descrizione del requisito

Dettagli del requisito

Dimensione massima del file (MB)

10240

Durata massima del video (minuti)

240

Formati file supportati

MP4, formati contenitore MOV, AVI, MKV o WEBM con codec video H.264, H.265/HEVC,, o MPEG-4 Visual VP8 VP9 AV1

Blueprint video massimi per progetto

1

Blueprint video massimi per la richiesta Start Inference

1

Risoluzione minima

24

Risoluzione massima

7680

Framerate minimo (frame al secondo)

1

Framerate massimo (frame al secondo)

60

Requisiti per i file audio

Descrizione del requisito

Dettagli del requisito

Lingue di input supportate

Inglese, Germania, spagnolo, francese, italiano, portoghese, giapponese, coreano, cinese, taiwanese e cantonese.

*Sono supportate tutte le versioni locali delle lingue di cui sopra.

Lingue di output supportate

Inglese o la lingua dominante dell'audio.

Frequenza di campionamento audio minima (Hz)

8000

Frequenza di campionamento audio massima (Hz)

48000

Dimensione massima del file (MB)

2048

Durata audio massima (minuti)

240

Lunghezza audio minima (millisecondi)

500

Formati file supportati

AMR, FLAC, M4A, Ogg, WAV MP3

Blueprint audio massimi per progetto

1

Blueprint audio massimi per la richiesta Start Inference

1

Numero massimo di canali audio per i file audio

2