View a markdown version of this page

Requisitos previos para utilizar Automatización de Datos de Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para utilizar Automatización de Datos de Bedrock

Los archivos de BDA deben cumplir ciertos requisitos para que se puedan procesar. En las tablas siguientes se muestran cuáles son esos requisitos para los distintos tipos de archivos.

Async

Requisitos de archivos de documentos asíncronos

En las siguientes tablas se muestran los requisitos de los archivos procesados con la API Async de Invoke Data Automation.

Requisitos de archivo de documento

Descripción del requisito

Detalles del requisito

(Consola) Número máximo de páginas por archivo de documento

20

Número máximo de páginas por documento con el divisor activado

3 000

(Consola) Tamaño máximo de archivo (MB)

200

Tamaño máximo de archivo (MB)

500

Formatos de archivo compatibles

PDF, TIFF, JPEG, PNG, DOCX

Límites específicos de la API

La altura y el ancho máximos son 40 pulgadas y 9000 puntos. PDFs no se puede proteger con contraseña. PDFs puede contener imágenes con formato JPEG 2000.

Rotación del documento y tamaño de la imagen

BDA admite todas las rotaciones de documentos en el plano, por ejemplo, la rotación en el plano de 45 grados.

BDA admite imágenes con una resolución inferior o igual a 10 000 píxeles en todos los lados.

Alineación de texto

El texto puede ser texto alineado horizontalmente dentro del documento. El texto dispuesto horizontalmente se puede leer independientemente del grado de rotación del documento. BDA no admite la alineación vertical del texto (texto escrito verticalmente, como es habitual en idiomas como el japonés y el chino) dentro del documento.

Tamaño de caracteres

La altura mínima para detectar el texto es de 15 píxeles. Un valor de PPP de 150 sería lo mismo que una fuente de 8 puntos.

Tipos de caracteres

BDA admite el reconocimiento de caracteres manuscritos e impresos.

nota

Para procesar los archivos DOCX, se convierten a. PDFs Esto significa que la asignación de números de página no funcionará para los archivos DOCX. Si selecciona la opción JSON+ y la granularidad de la página, las imágenes convertidas PDFs se cargarán en el depósito de salida.

La optimización de las instrucciones de Blueprint admite todos los límites anteriores para los documentos, con las siguientes diferencias:

  • Un total de 10 ejemplos de activos documentales

  • Ejemplo de activo de 20 páginas por documento en la consola y la API

  • 200 MB para el ejemplo total del recurso documental

  • Solo los formatos de archivo de documentos PDF, DOCX y TIFF

Sync

Requisitos de sincronización de archivos de documentos

En las siguientes tablas se muestran los requisitos de los archivos procesados con la API Invoke Data Automation.

Requisitos de archivo de documento

Descripción del requisito

Detalles del requisito

(Consola) Número máximo de páginas por archivo de documento

10

Número máximo de páginas por archivo de documento (el separador no está disponible)

10

(Consola) Tamaño máximo de archivo (MB)

50

Tamaño máximo de archivo (MB)

50

Formatos de archivo compatibles

PDF, TIFF, JPEG, PNG

Límites específicos de la API

La altura y el ancho máximos son 40 pulgadas y 9000 puntos. PDFs no se puede proteger con contraseña. PDFs puede contener imágenes con formato JPEG 2000.

Rotación del documento y tamaño de la imagen

BDA admite todas las rotaciones de documentos en el plano, por ejemplo, la rotación en el plano de 45 grados.

BDA admite imágenes con una resolución inferior o igual a 10 000 píxeles en todos los lados.

Alineación de texto

El texto puede ser texto alineado horizontalmente dentro del documento. El texto dispuesto horizontalmente se puede leer independientemente del grado de rotación del documento. BDA no admite la alineación vertical del texto (texto escrito verticalmente, como es habitual en idiomas como el japonés y el chino) dentro del documento.

Tamaño de caracteres

La altura mínima para detectar el texto es de 15 píxeles. Un valor de PPP de 150 sería lo mismo que una fuente de 8 puntos.

Tipos de caracteres

BDA admite el reconocimiento de caracteres manuscritos e impresos.

nota

Los subtítulos de figuras funcionan con 20 imágenes por documento de 10 páginas (sincronizadas) y 20 imágenes por página (asíncronas).

sugerencia

Consejos para acelerar el procesamiento de la API de sincronización:

  • Desactive los campos generativos a menos que sea absolutamente necesario.

  • Seleccione solo la granularidad y el formato de texto de salida que necesite (en lugar de seleccionar varios).

  • Simplifique su plan para reducir la cantidad de campos extraídos en la medida de lo posible.

  • Reduzca la cantidad de campos de tablas y listas en su plano siempre que sea posible.

Requisitos del plano

Descripción del requisito

Detalles del requisito

Número máximo de planos por proyecto

40

Número máximo de proyectos por cuenta

100

Número máximo de planos por cuenta

1 000

Número máximo de versiones del blueprint

100

Número máximo de campos de hojas de planos

100

Número máximo de campos de hoja de lista de planos

30

Longitud máxima del nombre del blueprint

60 caracteres

Longitud máxima de la descripción del campo del esquema

600 caracteres (documento), 500 caracteres () image/video/audio

Longitud máxima del nombre del campo del esquema

60 caracteres

Tamaño máximo del plano

100.000 caracteres (con formato JSON)

Requisitos de archivos de imágenes

Descripción del requisito

Detalles del requisito

Tamaño máximo de archivo (MB)

5

Resolución máxima

8000

Formatos de archivo compatibles

JPEG, PNG

Requisitos de archivos de vídeo

Descripción del requisito

Detalles del requisito

Tamaño máximo de archivo (MB)

10240

Duración máxima del vídeo (minutos)

240

Formatos de archivo compatibles

MP4, formatos de contenedor MOV, AVI, MKV o WEBM con códecs de vídeo visual H.264, H.265/HEVC,, VP8 o MPEG-4 VP9 AV1

Número máximo de esquemas de vídeo por proyecto

1

Número máximo de esquemas de vídeo por solicitud de inicio de inferencia

1

Resolución mínima

224

Resolución máxima

7680

Velocidad de fotogramas mínima (fotogramas por segundo)

1

Velocidad de fotogramas máxima (fotogramas por segundo)

60

Requisitos de los archivos de audio

Descripción del requisito

Detalles del requisito

Idiomas de entrada compatibles

Inglés, Alemania, español, francés, italiano, portugués, japonés, coreano, chino, taiwanés y cantonés.

*Todas las configuraciones regionales son compatibles con los idiomas anteriores.

Idiomas de salida compatibles

Inglés o el idioma dominante del audio.

Frecuencia mínima de muestreo de audio (Hz)

8000

Frecuencia mínima de muestreo de audio (Hz)

48000

Tamaño máximo de archivo (MB)

2048

Duración máxima de audio (minutos)

240

Duración mínima de audio (milisegundos)

500

Formatos de archivo compatibles

AMR, FLAC, M4A, Ogg, WAV MP3

Número máximo de esquemas de audio por proyecto

1

Número máximo de esquemas de audio por solicitud de inicio de inferencia

1

Número máximo de canales de audio para los archivos de audio

2