View a markdown version of this page

Vocabulário personalizado - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Vocabulário personalizado

Você pode fornecer palavras e frases específicas do domínio por idioma, o que permite que o BDA melhore a precisão da extração de seu conteúdo de áudio e vídeo. Você pode incluir terminologia exclusiva do seu setor ou domínio, como nomes de marcas, acrônimos, nomes próprios e termos especializados, o que permite que o BDA reconheça e extraia esses termos com precisão do conteúdo processado.

Importante

Você é responsável pela integridade de seus próprios dados ao usar a Biblioteca de Automação de Dados Bedrock. Não insira informações confidenciais, informações de identificação pessoal (PII) ou informações de saúde protegidas (PHI) em um vocabulário personalizado.

Você pode encontrar a lista de idiomas compatíveis com o Vocabulário Personalizado aqui. Observe que somente os caracteres listados no conjunto de caracteres do seu idioma podem ser usados em um vocabulário personalizado.

Como usar?

Você pode usar o vocabulário personalizado em seu projeto do BDA criando uma biblioteca de automação de dados, adicionando vocabulário específico de domínio entities/lists para seu idioma de destino e associando a biblioteca ao seu projeto durante a criação do projeto ou atualizando um projeto existente, o que permite que todos os trabalhos de processamento de áudio e vídeo executados por meio desse projeto apliquem seu vocabulário personalizado. Isso resulta em maior precisão de extração para os termos específicos do seu domínio, tanto na saída padrão quanto na saída personalizada do blueprint.

Considerações ao usar o vocabulário personalizado:

  • Concentre-se em termos específicos do domínio que são frequentemente reconhecidos erroneamente

  • Inclua variações e grafias comuns de termos importantes

  • Organize o vocabulário por idioma para um melhor gerenciamento

  • Priorize o jargão e os termos técnicos específicos do setor

  • Inclua siglas e abreviações comumente usadas em seu domínio