Solicitar marcas de fala - Amazon Polly

Solicitar marcas de fala

É possível usar o console ou o comando synthesize-speech para solicitar marcas de fala do Amazon Polly. Em seguida, visualize os metadados ou salve-os em um arquivo.

Console
Como gerar marcas de fala no console
  1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon Polly em https://console.aws.amazon.com/polly/.

  2. Selecione a guia Text-to-Speech.

  3. Ative o SSML para usar o SSML.

  4. Digite ou cole o texto na caixa de entrada.

  5. Para Idioma, escolha o idioma do texto.

  6. Para Voz, escolha a voz que você deseja usar.

  7. Para alterar a pronúncia do texto, expanda Configurações adicionais, ative Personalizar pronúncia e, em Aplicar léxico, escolha o léxico desejado.

  8. Para verificar a fala, escolha Ouvir.

  9. Ative as Configurações de formato de arquivo de voz.

    nota

    Baixar formatos MP3, OGG ou PCM não gera marcas de fala.

  10. Para Formato de arquivo, escolha Marcas de fala.

  11. Para Tipos de marca de fala, escolha os tipos de marcas de fala a serem gerados. A opção para escolher metadados SSML só está disponível quando o SSML está ativo. Para obter mais informações sobre como usar SSML com o Amazon Polly, consulte Gerar fala com base em documentos SSML.

  12. Escolha Baixar.

AWS CLI

Além do texto de entrada, os seguintes elementos são necessários para retornar esses metadados:

  • output-format

    O Amazon Polly é compatível apenas com o formato JSON ao retornar marcas de fala.

    --output-format json

    Se você usar um formato de saída não compatível, o Amazon Polly lançará uma exceção.

  • voice-id

    Para garantir que os metadados correspondam ao fluxo de áudio associado, especifique a mesma voz usada para gerar o fluxo de áudio de fala sintetizado. As vozes disponíveis não têm velocidades de fala idênticas. Se você usar uma voz diferente daquela usado para gerar a fala, os metadados não corresponderão ao fluxo de áudio.

    --voice-id Joanna
  • speech-mark-types

    Especifique os tipos de marcas de fala desejados. Você pode solicitar qualquer um ou todos os tipos de marca de fala, mas deve especificar pelo menos um tipo.

    --speech-mark-types='["sentence", "word", "viseme", "ssml"]'
  • text-type

    Texto sem formatação é o padrão para texto de entrada no Amazon Polly. Você deve usar text-type ssml se quiser retornar marcas de fala em SSML.

  • outfile

    Especifique o arquivo de saída ao qual os metadados são gravados.

    MaryLamb.txt

O exemplo da AWS CLI a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.

aws polly synthesize-speech \ --output-format json \ --voice-id Voice ID \ --text 'Input text' \ --speech-mark-types='["sentence", "word", "viseme"]' \ outfile