Conditions préalables à l’utilisation de l’automatisation des données Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables à l’utilisation de l’automatisation des données Bedrock

Les fichiers destinés à BDA doivent répondre à certaines exigences pour être traités. Les tableaux suivants indiquent la nature de ces exigences pour différents types de fichiers.

Exigences relatives aux fichiers de documents

Description de l’exigence

Détails de l’exigence

(Console) Nombre maximal de pages par fichier de document

20

Nombre maximal de pages par document lorsque l’utilitaire de fractionnement est activé

3000

(Console) Taille de fichier maximale (Mo)

200

Taille de fichier maximale (Mo)

500

Formats de fichiers pris en charge

PDF, TIFF, JPEG, PNG, DOCX

Limites propres aux fichiers PDF

La hauteur et la largeur maximales sont de 40 pouces et de 9 000 points. PDFs ne peut pas être protégé par mot de passe. PDFs peut contenir des images au format JPEG 2000.

Rotation de document et taille d’image

BDA prend en charge toutes les rotations de documents dans le plan, par exemple la rotation dans le plan de 45 degrés.

BDA prend en charge les images dont la résolution est inférieure ou égale à 10 000 pixels sur tous les côtés.

Alignement du texte

Le texte peut être aligné horizontalement dans le document. Le texte présenté horizontalement peut être lu quel que soit le degré de rotation du document. BDA ne prend pas en charge l’alignement vertical du texte (texte écrit verticalement, comme c’est souvent le cas dans des langues telles que le japonais et le chinois) dans le document.

Taille de caractère

La hauteur minimale du texte à détecter est de 15 pixels. À 150 DPI, cela équivaudrait à une police à 8 points.

Type de caractère

BDA prend en charge la reconnaissance des caractères écrits à la main et imprimés.

Note

Pour traiter les fichiers DOCX, ils sont convertis en. PDFs Autrement dit, le mappage des numéros de page ne fonctionne pas pour les fichiers DOCX. Les images du fichier converti PDFs seront téléchargées dans votre compartiment de sortie si l'option JSON+ et la granularité de la page sont sélectionnées.

L'optimisation des instructions Blueprint prend en charge toutes les limites ci-dessus pour les documents présentant les différences suivantes :

  • Au total, 10 exemples de ressources documentaires

  • Exemple de ressource de 20 pages par document sur console et API

  • 200 Mo pour le total des ressources documentaires, par exemple

  • Formats de fichier PDF, DOCX et TIFF uniquement

Exigences relatives aux fichiers image

Description de l’exigence

Détails de l’exigence

Taille de fichier maximale (Mo)

5

Résolution maximale

8 000

Formats de fichiers pris en charge

JPEG, PNG

Exigences relatives aux fichiers vidéo

Description de l’exigence

Détails de l’exigence

Taille de fichier maximale (Mo)

10240

Durée de vidéo maximale (minutes)

240

Formats de fichiers pris en charge

MP4, formats de conteneur MOV, AVI, MKV ou WEBM avec codecs vidéo H.264, H.265/HEVC,, VP8, VP9 ou MPEG-4 Visual AV1

Nombre maximal de plans vidéo par projet

1

Nombre maximal de plans vidéo par demande d’inférence de démarrage

1

Résolution minimale

224

Résolution maximale

7680

Fréquence de trames minimale (trames par seconde)

1

Fréquence de trames maximale (trames par seconde)

60

Exigences relatives aux fichiers audio

Description de l’exigence

Détails de l’exigence

Langues de saisie prises en charge

Anglais, Allemagne, espagnol, français, italien, portugais, japonais, coréen, chinois, taïwanais et cantonais.

*Toutes les langues ci-dessus sont prises en charge.

Langues de sortie prises en charge

L'anglais, ou langue dominante de l'audio.

Fréquence d’échantillonnage audio minimale (Hz)

8000

Fréquence d’échantillonnage audio maximale (Hz)

48000

Taille de fichier maximale (Mo)

2048

Durée audio maximale (minutes)

240

Durée audio minimale (millisecondes)

500

Formats de fichiers pris en charge

AMR, FLAC, M4A, Ogg MP3, WAV

Nombre maximal de plans audio par projet

1

Nombre maximal de plans audio par demande d’inférence de démarrage

1

Nombre maximal de canaux audio pour les fichiers audio

2