Tipos de marca de fala
Solicite marcas de fala usando a opção SpeechMarkTypes para os comandos SynthesizeSpeech ou StartSpeechSynthesisTask. Você especifica os elementos de metadados que deseja retornar do texto de entrada. Você pode solicitar até quatro tipos de metadados, mas deve especificar pelo menos um por solicitação. Nenhuma saída de áudio é gerada com a solicitação.
Na AWS CLI, por exemplo:
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
O Amazon Polly gera marcas de fala usando os seguintes elementos.
-
sentence – Indica um elemento de frase no texto de entrada.
-
word – Indica um elemento de palavra no texto.
-
visema: descreve os movimentos faciais e orais correspondentes a cada fonema falado. Para obter mais informações, consulte Visemas e Amazon Polly.
-
ssml: descreve um elemento <mark> do texto de entrada SSML. Para obter mais informações, consulte Gerar fala com base em documentos SSML.