Pré-requisitos para usar a Automação de Dados do Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pré-requisitos para usar a Automação de Dados do Bedrock

Os arquivos para a BDA precisam atender a determinados requisitos para serem processados. As tabelas a seguir mostram quais são esses requisitos para diferentes tipos de arquivo.

Requisitos de arquivo de documentos

Descrição do requisito

Detalhes do requisito

(Console) Número máximo de páginas por arquivo de documento

20

Número máximo de páginas por documento enquanto o divisor está habilitado

3000

(Console) Tamanho máximo do arquivo (MB)

200

Tamanho máximo do arquivo (MB)

500

Formatos de arquivo compatíveis

PDF, TIFF, JPEG, PNG, DOCX

Limites específicos de PDF

A altura e a largura máximas são de 40 polegadas e 9000 pontos. PDFs não pode ser protegido por senha. PDFs pode conter imagens no formato JPEG 2000.

Rotação do documento e tamanho da imagem

A BDA permite todas as rotações de documento no plano; por exemplo, rotação no plano de 45 graus.

A BDA permite imagens com resolução menor ou igual a 10.000 pixels em todos os lados.

Alinhamento de texto

O texto pode ser alinhado horizontalmente dentro do documento. O texto disposto horizontalmente pode ser lido de modo independente do grau de rotação de um documento. A BDA não permite o alinhamento vertical de texto no documento (texto escrito verticalmente, como é comum em idiomas como japonês e chinês).

Tamanho do caractere

A altura mínima para que o texto seja detectado é 15 pixels. Com 150 DPI, isso seria o mesmo que uma fonte de 8 pontos.

Tipos de caractere

A BDA permite reconhecimento de caracteres manuscritos e impressos.

nota

Para processar arquivos DOCX, eles são convertidos em PDFs. Isso significa que o mapeamento do número da página não funcionará para arquivos DOCX. As imagens do convertido PDFs serão enviadas para seu bucket de saída se a opção JSON+ e a granularidade da página forem selecionadas.

A otimização de instruções do Blueprint suporta todos os limites acima para documentos com as seguintes diferenças:

  • Um total de 10 exemplos de ativos de documentos

  • Exemplo de 20 páginas por ativo de documento no console e na API

  • Exemplo de 200 MB para o ativo total do documento

  • Somente formatos de arquivo de documento PDF, DOCX e TIFF

Requisitos de arquivo de imagens

Descrição do requisito

Detalhes do requisito

Tamanho máximo do arquivo (MB)

5

Resolução máxima

8k

Formatos de arquivo compatíveis

JPEG, PNG

Requisitos de arquivo de vídeo

Descrição do requisito

Detalhes do requisito

Tamanho máximo do arquivo (MB)

10240

Duração máxima do vídeo (minutos)

240

Formatos de arquivo compatíveis

MP4, formatos de contêiner MOV, AVI, MKV ou WEBM com codecs de vídeo visual H.264, H.265/HEVC,,, ou MPEG-4 VP8 VP9 AV1

Máximo de esquemas de vídeo por projeto

1

Máximo de esquemas de vídeo por solicitação para iniciar referência

1

Resolução mínima

224

Resolução máxima

7680

Taxa de quadros mínima (quadros por segundo)

1

Taxa de quadros máxima (quadros por segundo)

60

Requisitos de arquivo de áudio

Descrição do requisito

Detalhes do requisito

Idiomas de entrada suportados

Inglês, Alemanha, espanhol, francês, italiano, português, japonês, coreano, chinês, taiwanês e cantonês.

*Todas as localidades são suportadas nos idiomas acima.

Idiomas de saída suportados

Inglês ou o idioma dominante do áudio.

Taxa mínima de amostragem de áudio (Hz)

8000

Taxa máxima de amostragem de áudio (Hz)

48000

Tamanho máximo do arquivo (MB)

2048

Duração máxima do áudio (minutos)

240

Duração mínima de áudio (milissegundos)

500

Formatos de arquivo compatíveis

AMR, FLAC, M4A, Ogg, MP3 WAV

Máximo de esquemas de áudio por projeto

1

Máximo de esquemas de áudio por solicitação para iniciar inferência

1

Máximo de canais de áudio para arquivos de áudio

2