Uso de SSML con el comando de síntesis de voz - Amazon Polly

Uso de SSML con el comando de síntesis de voz

Este ejemplo muestra cómo utilizar el comando synthesize-speech con una cadena SSML. Cuando se utiliza el comando synthesize-speech, normalmente se proporciona lo siguiente:

  • El texto de entrada (obligatorio)

  • Las etiquetas de apertura y cierre (obligatorio)

  • El formato de salida

  • Una voz

En este ejemplo, especifica una cadena de texto sencilla entre comillas junto con las etiquetas <speak></speak> de apertura y cierre necesarias.

importante

Aunque no se utilizan comillas alrededor del texto de entrada en la consola de Amazon Polly, debe usarlas en la AWS CLI. También es importante que diferencie entre las comillas alrededor de texto de entrada y las comillas necesarias para las etiquetas individuales.

Por ejemplo, puede usar comillas normales (") para rodear el texto de entrada y comillas simples (') para las etiquetas internas, o viceversa. Cualquiera de las dos opciones funciona para Unix, Linux y macOS. Sin embargo, con Windows debe incluir el texto de entrada entre comillas normales y usar las comillas simples para las etiquetas.

Para todos los sistemas operativos, puede usar comillas normales (") para rodear el texto de entrada y comillas simples (') para las etiquetas internas. Por ejemplo:

--text "<speak>Hello <break time='300ms'/> World</speak>"

Para Unix, Linux y macOS, también puede usarlas al revés: las comillas simples (') para el texto de entrada y las comillas normales (") para las etiquetas internas:

--text '<speak>Hello <break time="300ms"/> World</speak>'

El ejemplo de AWS CLI siguiente tiene formato para Unix, Linux y macOS. En Windows, sustituya la barra invertida (\) del carácter de continuación de Unix al final de cada línea por un signo de intercalación (^) y utilice comillas completas (") alrededor del texto introducido con comillas simples (') para las etiquetas interiores.

aws polly synthesize-speech \ --text-type ssml \ --text '<speak>Hello world</speak>' \ --output-format mp3 \ --voice-id Joanna \ speech.mp3

Para oír el fragmento hablado sintetizado, reproduzca el archivo speech.mp3 resultante con un reproductor de sonido.