View a markdown version of this page

Pré-requisitos para usar a Automação de Dados do Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pré-requisitos para usar a Automação de Dados do Bedrock

Os arquivos para a BDA precisam atender a determinados requisitos para serem processados. As tabelas a seguir mostram quais são esses requisitos para diferentes tipos de arquivo.

Async

Requisitos de arquivo de documento assíncrono

As tabelas a seguir mostram os requisitos para arquivos processados usando a API Invoke Data Automation Async.

Requisitos de arquivo de documentos

Descrição do requisito

Detalhes do requisito

(Console) Número máximo de páginas por arquivo de documento

20

Número máximo de páginas por documento enquanto o divisor está habilitado

3000

(Console) Tamanho máximo do arquivo (MB)

200

Tamanho máximo do arquivo (MB)

500

Formatos de arquivo compatíveis

PDF, TIFF, JPEG, PNG, DOCX

Limites específicos de PDF

A altura e a largura máximas são de 40 polegadas e 9000 pontos. PDFs não pode ser protegido por senha. PDFs pode conter imagens formatadas em JPEG 2000.

Rotação do documento e tamanho da imagem

A BDA permite todas as rotações de documento no plano; por exemplo, rotação no plano de 45 graus.

A BDA permite imagens com resolução menor ou igual a 10.000 pixels em todos os lados.

Alinhamento de texto

O texto pode ser alinhado horizontalmente dentro do documento. O texto disposto horizontalmente pode ser lido de modo independente do grau de rotação de um documento. A BDA não permite o alinhamento vertical de texto no documento (texto escrito verticalmente, como é comum em idiomas como japonês e chinês).

Tamanho do caractere

A altura mínima para que o texto seja detectado é 15 pixels. Com 150 DPI, isso seria o mesmo que uma fonte de 8 pontos.

Tipos de caractere

A BDA permite reconhecimento de caracteres manuscritos e impressos.

nota

Para processar arquivos DOCX, eles são convertidos em PDFs. Isso significa que o mapeamento do número da página não funcionará para arquivos DOCX. As imagens do convertido PDFs serão enviadas para seu bucket de saída se a opção JSON+ e a granularidade da página forem selecionadas.

A otimização de instruções do Blueprint suporta todos os limites acima para documentos com as seguintes diferenças:

  • Um total de 10 exemplos de ativos de documentos

  • Exemplo de 20 páginas por ativo de documento no console e na API

  • Exemplo de 200 MB para o ativo total do documento

  • Somente formatos de arquivo de documento PDF, DOCX e TIFF

Sync

Requisitos de sincronização de arquivos de documentos

As tabelas a seguir mostram os requisitos para arquivos processados usando a API Invoke Data Automation.

Requisitos de arquivo de documentos

Descrição do requisito

Detalhes do requisito

(Console) Número máximo de páginas por arquivo de documento

10

Número máximo de páginas por arquivo de documento (o divisor não está disponível)

10

(Console) Tamanho máximo do arquivo (MB)

50

Tamanho máximo do arquivo (MB)

50

Formatos de arquivo compatíveis

PDF, TIFF, JPEG, PNG

Limites específicos de PDF

A altura e a largura máximas são de 40 polegadas e 9000 pontos. PDFs não pode ser protegido por senha. PDFs pode conter imagens formatadas em JPEG 2000.

Rotação do documento e tamanho da imagem

A BDA permite todas as rotações de documento no plano; por exemplo, rotação no plano de 45 graus.

A BDA permite imagens com resolução menor ou igual a 10.000 pixels em todos os lados.

Alinhamento de texto

O texto pode ser alinhado horizontalmente dentro do documento. O texto disposto horizontalmente pode ser lido de modo independente do grau de rotação de um documento. A BDA não permite o alinhamento vertical de texto no documento (texto escrito verticalmente, como é comum em idiomas como japonês e chinês).

Tamanho do caractere

A altura mínima para que o texto seja detectado é 15 pixels. Com 150 DPI, isso seria o mesmo que uma fonte de 8 pontos.

Tipos de caractere

A BDA permite reconhecimento de caracteres manuscritos e impressos.

nota

A legenda de figuras funciona em 20 imagens por documento de 10 páginas (sincronizado) e 20 imagens por página (assíncrono).

dica

Dicas para acelerar o processamento da API de sincronização:

  • Desative os campos generativos, a menos que seja absolutamente necessário.

  • Selecione somente a granularidade e o formato de texto de saída necessários (em vez de selecionar vários).

  • Simplifique seu Blueprint para reduzir o máximo possível o número de campos extraídos.

  • Reduza o número de campos de tabela e lista em seu blueprint sempre que possível.

Requisitos do Blueprint

Descrição do requisito

Detalhes do requisito

Número máximo de plantas por projeto

40

Número máximo de projetos por conta

100

Número máximo de plantas por conta

1000

Número máximo de versões do blueprint

100

Número máximo de campos de folha do blueprint

100

Número máximo de campos de folha da lista de esquemas

30

Tamanho máximo do nome do blueprint

60 caracteres

Tamanho máximo da descrição do campo do blueprint

600 caracteres (documento), 500 caracteres (image/video/audio)

Tamanho máximo do nome do campo do blueprint

60 caracteres

Tamanho máximo do blueprint

100.000 caracteres (formatado em JSON)

Requisitos de arquivo de imagens

Descrição do requisito

Detalhes do requisito

Tamanho máximo do arquivo (MB)

5

Resolução máxima

8k

Formatos de arquivo compatíveis

JPEG, PNG

Requisitos de arquivo de vídeo

Descrição do requisito

Detalhes do requisito

Tamanho máximo do arquivo (MB)

10240

Duração máxima do vídeo (minutos)

240

Formatos de arquivo compatíveis

MP4, formatos de contêiner MOV, AVI, MKV ou WEBM com codecs de vídeo visual H.264, H.265/HEVC,,, ou MPEG-4 VP8 VP9 AV1

Máximo de esquemas de vídeo por projeto

1

Máximo de esquemas de vídeo por solicitação para iniciar referência

1

Resolução mínima

224

Resolução máxima

7680

Taxa de quadros mínima (quadros por segundo)

1

Taxa de quadros máxima (quadros por segundo)

60

Requisitos de arquivo de áudio

Descrição do requisito

Detalhes do requisito

Idiomas de entrada suportados

Inglês, Alemanha, espanhol, francês, italiano, português, japonês, coreano, chinês, taiwanês e cantonês.

*Todas as localidades são suportadas nos idiomas acima.

Idiomas de saída suportados

Inglês, ou o idioma dominante do áudio.

Taxa mínima de amostragem de áudio (Hz)

8000

Taxa máxima de amostragem de áudio (Hz)

48000

Tamanho máximo do arquivo (MB)

2048

Duração máxima do áudio (minutos)

240

Duração mínima de áudio (milissegundos)

500

Formatos de arquivo compatíveis

AMR, FLAC, M4A, Ogg, MP3 WAV

Máximo de esquemas de áudio por projeto

1

Máximo de esquemas de áudio por solicitação para iniciar inferência

1

Máximo de canais de áudio para arquivos de áudio

2