As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Projetos da Automação de Dados do Bedrock
Uma forma de processar arquivos usando a Automação de Dados do Amazon Bedrock (BDA) é criar um projeto. Um projeto é um agrupamento de configurações de saída padrão personalizadas. Nos projetos, as saídas padrão são necessárias, mas as saídas personalizadas são opcionais. Quando você chama a API InvokeDataAutomationAsync com um ARN de projeto, o arquivo é processado automaticamente usando as configurações definidas nesse projeto. A saída é então gerada com base na configuração do projeto.
Um projeto pode receber uma etapa, LIVE ou DEVELOPMENT. Cada estágio é uma versão única e mutável do projeto. Isso significa que é possível editar ou testar por meio do estágio DEVELOPMENT e processar as solicitações dos clientes usando o estágio LIVE. Os projetos DEVELOPMENT não podem ser acessados no console e devem ser alterados e invocados por meio da API.
Um projeto permite que você use um único recurso para vários tipos de arquivo. Por exemplo, um arquivo de áudio enviado à BDA usando o nome de projeto ABC será processado usando a configuração de saída padrão de áudio do projeto ABC. Um documento enviado à BDA usando o nome de projeto ABC será processado usando a configuração de saída padrão do documento do projeto ABC.
Os projetos oferecem maior flexibilidade ao configurar saídas padrão. Cada saída padrão tem seu próprio conjunto de opções configuráveis, como transcrições ou resumos, e os projetos permitem que você altere essas opções para que atendam melhor ao seu caso de uso. Para definir uma saída personalizada, também é possível configurar um projeto com esquemas para documentos, áudio e imagens. Um projeto configurado para gerar uma saída personalizada também gerará uma saída padrão automaticamente.
As seções a seguir apresentarão alguns exemplos de uso de projeto.
Usar projetos com saída padrão
Vamos considerar um caso de uso no qual você só queira extrair resumos de transcrições dos arquivos completos de áudio e vídeo. Por padrão, ao enviar arquivos de áudio e vídeo à BDA, você recebe os resumos da transcrição com as transcrições completas, resumos em nível de cena, texto detectado e outras informações. Nesse caso de uso, você provavelmente não quer gastar tempo nem recursos extras para coletar informações desnecessárias. Para esse caso de uso, você pode configurar um projeto de saída padrão para habilitar somente o recurso de resumo para arquivos de áudio e vídeo.
Para fazer isso usando a API ou o console, crie um projeto e modifique as configurações de saída padrão para áudio e vídeo. Para vídeo, habilite Resumo de vídeo completo, mas observe que outras extrações (p. ex., transcrição de áudio completo, resumos de cenas, moderação de conteúdo etc.) estejam desabilitadas. Repita essa configuração para áudio. Depois de configurar o projeto para gerar somente resumos, salve-o e anote o nome do recurso da Amazon (ARN) do projeto. Esse ARN pode ser usado para a operação InvokeDataAutomationAsync para processar os arquivos em grande escala. Ao transmitir um arquivo de áudio ou vídeo à BDA e especificar o ARN desse projeto, você receberá uma saída somente dos resumos de cada um dos arquivos. Observe que, neste exemplo, não foi realizada nenhuma configuração para documentos ou imagens. Isso significa que, se você transmitir uma imagem ou documento à BDA usando o ARN desse projeto, receberá a saída padrão para esses arquivos.
Usar projetos com saída personalizada e saída padrão
Para esse caso de uso, vamos supor que você queira gerar resumos de saída padrão para documentos e arquivos de áudio e também extrair campos personalizados dos documentos. Depois de criar um projeto, configure a saída padrão para áudio para habilitar o Resumo de áudio completo e garanta que as outras extrações não estejam habilitadas. Repita essa configuração de saída padrão para documentos. Em seguida, você pode configurar a saída personalizada para documentos adicionando um esquema novo ou preexistente do catálogo global da BDA. Os documentos transmitidos à BDA usando o ARN desse projeto gerarão a saída padrão, resumos do documento completo e a saída do esquema para os campos personalizados definidos. Os arquivos de áudio transmitidos à BDA usando o ARN desse projeto gerarão resumos completos.
Ao processar documentos, talvez você queira usar vários esquemas para diferentes tipos de documento que são transmitidos ao projeto. Um projeto pode ter até quarenta esquemas de documentos anexados. A BDA combina automaticamente os documentos com o esquema apropriado que está configurado em seu projeto e gera resultados personalizados usando esse esquema. Além disso, você pode transmitir documentos em massa. Se você transmitir um arquivo que contém vários documentos, poderá optar por dividir o documento ao criar seu projeto. Se você optar por fazer isso, a BDA digitalizará o arquivo e o dividirá em documentos individuais com base no contexto. Esses documentos individuais são então compatibilizados com o esquema correto para processamento.
No momento, as imagens permitem apenas uma definição de esquema por projeto. Os tipos de arquivo de imagem JPG e PNG podem ser tratados como imagens ou documentos digitalizados com base no respectivo conteúdo. Recomendamos que você crie um esquema personalizado para imagens ao processar a saída personalizada para documentos. Desse modo, a BDA fornecerá a saída desejada para arquivos de imagem que contenham texto.
Os arquivos de áudio também permitem apenas a uma definição de esquema por projeto.