View a markdown version of this page

Conditions préalables à l’utilisation de l’automatisation des données Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables à l’utilisation de l’automatisation des données Bedrock

Les fichiers destinés à BDA doivent répondre à certaines exigences pour être traités. Les tableaux suivants indiquent la nature de ces exigences pour différents types de fichiers.

Async

Exigences relatives aux fichiers de documents asynchrones

Les tableaux suivants indiquent les exigences relatives aux fichiers traités à l'aide de l'API asynchrone d'Invoke Data Automation.

Exigences relatives aux fichiers de documents

Description de l’exigence

Détails de l’exigence

(Console) Nombre maximal de pages par fichier de document

20

Nombre maximal de pages par document lorsque l’utilitaire de fractionnement est activé

3000

(Console) Taille de fichier maximale (Mo)

200

Taille de fichier maximale (Mo)

500

Formats de fichiers pris en charge

PDF, TIFF, JPEG, PNG, DOCX

Limites propres aux fichiers PDF

La hauteur et la largeur maximales sont de 40 pouces et de 9 000 points. PDFs ne peut pas être protégé par mot de passe. PDFs peut contenir des images au format JPEG 2000.

Rotation de document et taille d’image

BDA prend en charge toutes les rotations de documents dans le plan, par exemple la rotation dans le plan de 45 degrés.

BDA prend en charge les images dont la résolution est inférieure ou égale à 10 000 pixels sur tous les côtés.

Alignement du texte

Le texte peut être aligné horizontalement dans le document. Le texte présenté horizontalement peut être lu quel que soit le degré de rotation du document. BDA ne prend pas en charge l’alignement vertical du texte (texte écrit verticalement, comme c’est souvent le cas dans des langues telles que le japonais et le chinois) dans le document.

Taille de caractère

La hauteur minimale du texte à détecter est de 15 pixels. À 150 DPI, cela équivaudrait à une police à 8 points.

Type de caractère

BDA prend en charge la reconnaissance des caractères écrits à la main et imprimés.

Note

Pour traiter les fichiers DOCX, ils sont convertis en. PDFs Autrement dit, le mappage des numéros de page ne fonctionne pas pour les fichiers DOCX. Les images du fichier converti PDFs seront téléchargées dans votre compartiment de sortie si l'option JSON+ et la granularité de la page sont sélectionnées.

L'optimisation des instructions Blueprint prend en charge toutes les limites ci-dessus pour les documents présentant les différences suivantes :

  • Au total, 10 exemples de ressources documentaires

  • Exemple de ressource de 20 pages par document sur console et API

  • 200 Mo pour le total des ressources documentaires, par exemple

  • Formats de fichier PDF, DOCX et TIFF uniquement

Sync

Exigences relatives à la synchronisation des fichiers de documents

Les tableaux suivants indiquent les exigences relatives aux fichiers traités à l'aide de l'API Invoke Data Automation.

Exigences relatives aux fichiers de documents

Description de l’exigence

Détails de l’exigence

(Console) Nombre maximal de pages par fichier de document

10

Nombre maximum de pages par fichier de document (le séparateur n'est pas disponible)

10

(Console) Taille de fichier maximale (Mo)

50

Taille de fichier maximale (Mo)

50

Formats de fichiers pris en charge

PDF, TIFF, JPEG, PNG

Limites propres aux fichiers PDF

La hauteur et la largeur maximales sont de 40 pouces et de 9 000 points. PDFs ne peut pas être protégé par mot de passe. PDFs peut contenir des images au format JPEG 2000.

Rotation de document et taille d’image

BDA prend en charge toutes les rotations de documents dans le plan, par exemple la rotation dans le plan de 45 degrés.

BDA prend en charge les images dont la résolution est inférieure ou égale à 10 000 pixels sur tous les côtés.

Alignement du texte

Le texte peut être aligné horizontalement dans le document. Le texte présenté horizontalement peut être lu quel que soit le degré de rotation du document. BDA ne prend pas en charge l’alignement vertical du texte (texte écrit verticalement, comme c’est souvent le cas dans des langues telles que le japonais et le chinois) dans le document.

Taille de caractère

La hauteur minimale du texte à détecter est de 15 pixels. À 150 DPI, cela équivaudrait à une police à 8 points.

Type de caractère

BDA prend en charge la reconnaissance des caractères écrits à la main et imprimés.

Note

Le sous-titrage des figures fonctionne sur 20 images par document de 10 pages (synchronisation) et sur 20 images par page (asynchrone).

Astuce

Conseils pour accélérer le traitement de l'API de synchronisation :

  • Désactivez les champs génératifs sauf si cela est absolument nécessaire.

  • Sélectionnez uniquement la granularité et le format de texte de sortie dont vous avez besoin (au lieu d'en sélectionner plusieurs).

  • Simplifiez votre Blueprint afin de réduire au maximum le nombre de champs extraits.

  • Réduisez le nombre de champs de table et de liste dans votre plan dans la mesure du possible.

Exigences relatives au plan

Description de l’exigence

Détails de l’exigence

Nombre maximum de plans par projet

40

Nombre maximum de projets par compte

100

Nombre maximum de plans par compte

1 000

Nombre maximum de versions du plan

100

Nombre maximum de champs de feuilles du plan

100

Nombre maximum de champs de feuilles de liste de plans

30

Longueur maximale du nom du plan

60 personnages

Longueur maximale du champ de description du plan

600 caractères (document), 500 caractères (image/video/audio)

Longueur maximale du nom du champ du plan

60 personnages

Taille maximale du plan

100 000 caractères (format JSON)

Exigences relatives aux fichiers image

Description de l’exigence

Détails de l’exigence

Taille de fichier maximale (Mo)

5

Résolution maximale

8 000

Formats de fichiers pris en charge

JPEG, PNG

Exigences relatives aux fichiers vidéo

Description de l’exigence

Détails de l’exigence

Taille de fichier maximale (Mo)

10240

Durée de vidéo maximale (minutes)

240

Formats de fichiers pris en charge

MP4, formats de conteneur MOV, AVI, MKV ou WEBM avec codecs vidéo H.264, H.265/HEVC,, VP8, VP9 ou MPEG-4 Visual AV1

Nombre maximal de plans vidéo par projet

1

Nombre maximal de plans vidéo par demande d’inférence de démarrage

1

Résolution minimale

224

Résolution maximale

7680

Fréquence de trames minimale (trames par seconde)

1

Fréquence de trames maximale (trames par seconde)

60

Exigences relatives aux fichiers audio

Description de l’exigence

Détails de l’exigence

Langues de saisie prises en charge

Anglais, Allemagne, espagnol, français, italien, portugais, japonais, coréen, chinois, taïwanais et cantonais.

*Toutes les langues ci-dessus sont prises en charge.

Langues de sortie prises en charge

L'anglais, ou langue dominante de l'audio.

Fréquence d’échantillonnage audio minimale (Hz)

8000

Fréquence d’échantillonnage audio maximale (Hz)

48000

Taille de fichier maximale (Mo)

2048

Durée audio maximale (minutes)

240

Durée audio minimale (millisecondes)

500

Formats de fichiers pris en charge

AMR, FLAC, M4A, Ogg MP3, WAV

Nombre maximal de plans audio par projet

1

Nombre maximal de plans audio par demande d’inférence de démarrage

1

Nombre maximal de canaux audio pour les fichiers audio

2