View a markdown version of this page

Solicitar marcas de fala - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solicitar marcas de fala

É possível usar o console ou o comando synthesize-speech para solicitar marcas de fala do Amazon Polly. Em seguida, visualize os metadados ou salve-os em um arquivo.

Console
Como gerar marcas de fala no console
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/

  2. Selecione a guia Text-to-Speech.

  3. Ative o SSML para usar o SSML.

  4. Digite ou cole o texto na caixa de entrada.

  5. Para Idioma, escolha o idioma do texto.

  6. Para Voz, escolha a voz que você deseja usar.

  7. Para alterar a pronúncia do texto, expanda Configurações adicionais, ative Personalizar pronúncia e, em Aplicar léxico, escolha o léxico desejado.

  8. Para verificar a fala, escolha Ouvir.

  9. Ative as Configurações de formato de arquivo de voz.

    nota

    Os formatos de download MP3 OGG, PCM, Mu-law ou A-law não gerarão marcas de fala.

  10. Para Formato de arquivo, escolha Marcas de fala.

  11. Para Tipos de marca de fala, escolha os tipos de marcas de fala a serem gerados. A opção para escolher metadados SSML só está disponível quando o SSML está ativo. Para obter mais informações sobre como usar SSML com o Amazon Polly, consulte Gerar fala com base em documentos SSML.

  12. Escolha Baixar.

AWS CLI

Além do texto de entrada, os seguintes elementos são necessários para retornar esses metadados:

  • output-format

    O Amazon Polly é compatível apenas com o formato JSON ao retornar marcas de fala.

    --output-format json

    Se você usar um formato de saída não compatível, o Amazon Polly lançará uma exceção.

  • voice-id

    Para garantir que os metadados correspondam ao fluxo de áudio associado, especifique a mesma voz usada para gerar o fluxo de áudio de fala sintetizado. As vozes disponíveis não têm velocidades de fala idênticas. Se você usar uma voz diferente daquela usado para gerar a fala, os metadados não corresponderão ao fluxo de áudio.

    --voice-id Joanna
  • speech-mark-types

    Especifique os tipos de marcas de fala desejados. Você pode solicitar qualquer um ou todos os tipos de marca de fala, mas deve especificar pelo menos um tipo.

    --speech-mark-types='["sentence", "word", "viseme", "ssml"]'
  • text-type

    Texto sem formatação é o padrão para texto de entrada no Amazon Polly. Você deve usar text-type ssml se quiser retornar marcas de fala em SSML.

  • outfile

    Especifique o arquivo de saída ao qual os metadados são gravados.

    MaryLamb.txt

O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.

aws polly synthesize-speech \ --output-format json \ --voice-id Voice ID \ --text 'Input text' \ --speech-mark-types='["sentence", "word", "viseme"]' \ outfile