翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
音量、話す速度、ピッチを制御する
<prosody>
Prosody タグ属性は、標準の TTS 音声によって完全にサポートされています。生成音声、ニューラル音声、ロングフォーム音声は volumeおよび rate 属性をサポートしますが、 pitch 属性はサポートしません。生成音声の場合、prosody タグは完全な文の周囲でのみ使用できます。
選択した音声の音量、速度、ピッチを制御するには、prosody タグを使用します。
音量、ピッチ、話す速度は、選択された特定の音声に依存します。異なる言語の音声間で異なるだけではなく、同じ言語を話す個々の音声にも違いがあります。このため、属性はすべての言語でもほぼ共通していますが、言語によって明らかな差異があり、絶対値はありません。
prosody タグには 3 つの属性が含まれており、それぞれに属性を設定する複数の値があります。各属性には同じ構文が使用されます。
<prosody attribute="value"></prosody>-
volume-
default: ボリュームを現在の音声のデフォルトレベルにリセットします。 -
silent、x-soft、soft、medium、loud、x-loud: ボリュームを、現在の音声の事前定義された値に設定します。 -
+ndB、-ndB: 現在の音量レベルと比較して音量を変更します。値+0dBは、ボリュームを変更しない、+6dBは、現在のボリュームの約 2 倍、-6dBは、現在のボリュームの約半分であることを表します。
たとえば、次のように文章に音量を設定します。
<speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>または、次のように設定することもできます。
<speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak> -
-
rate-
x-slow、slow、medium、fast、x-fast: ピッチを選択音声用に事前定義した値に設定します。 -
n%: 話す速度を正のパーセンテージで変更します。たとえば、100% では話す速度は変更されず、200% の値は話す速度がデフォルトの速度の 2 倍の速度、50% の値はデフォルトの話す速度の半分の速度を意味します。この値の範囲は 20 ~ 200% です。
たとえば、次のように文章に話す速度を設定します。
<speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>または、次のように設定することもできます。
<speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak> -
-
pitch-
default: ピッチを現在の音声のデフォルトレベルにリセットします。 -
x-low、low、medium、high、x-high: ピッチを現在音声用に事前定義した値に設定します。 -
+n%または-n%: 相対パーセンテージを使用してピッチを調整します。たとえば、値+0%は、ベースラインピッチを変更しない、+5%は、ベースラインピッチを少し上げる、-5%は、ベースラインピッチを少し下げることを意味します。
たとえば、次のように文章にピッチを設定します。
<speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>または、次のように設定することもできます。
<speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak> -
<prosody> タグには属性が少なくとも 1 つ含まれている必要がありますが、同じタグ内に複数含めることができます。
<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>
次のように、ネストされたタグを組み合わせることもできます。
<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>