

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Visemes 和 Amazon Polly
<a name="viseme"></a>

*視素*代表說出文字時臉部和嘴部的位置。它同等視覺上的音素，是形成單字的基本聲音單位。視素是語音的基本視覺化建置區塊。

每種語言都有一組與其特定音素對應的視覺效果。在語言中，每個音素都有對應的視素，其代表形成聲音時的嘴形。不過，並非所有視素都可對應到特定得音素，因為許多音素在說出時看起來相同，即使聽起來不同。例如，英文中的「pet」和「bet」這兩個詞在聲音上不同。但是，在視覺上觀察 (沒有聲音) 時，它們看起來完全相同。

下表列出國際音標 (IPA) 音素和拓展音標字母評估法 (X-SAMPA) 符號的部分清單，以及美式英文聲音對應的視素

如需所有可用語言的完整表格，請參閱[Amazon Polly 中的語言](supported-languages.md)。


<table>
<thead>
  <tr><th>IPA</th><th>X-SAMPA</th><th>Description</th><th>範例</th><th>視素</th></tr>
</thead>
<tbody>
  <tr><td colspan="5">**子音**</td></tr>
  <tr><td>b</td><td>b</td><td>濁雙唇塞音</td><td>**b**ed</td><td>p</td></tr>
  <tr><td>d</td><td>d</td><td>濁齒齦塞音</td><td>**d**ig</td><td>t</td></tr>
  <tr><td>d͡ʒ</td><td>dZ</td><td>濁顎齦塞擦音</td><td>**j**ump</td><td>S</td></tr>
  <tr><td>ð</td><td>D</td><td>濁齒擦音</td><td>**then**</td><td>T</td></tr>
  <tr><td>f</td><td>f</td><td>清唇齒擦音</td><td>**f**ive</td><td>f</td></tr>
  <tr><td>g</td><td>g</td><td>濁軟顎塞音</td><td>**g**ame</td><td>k</td></tr>
  <tr><td>h</td><td>h</td><td>清聲門擦音</td><td>**h**ouse</td><td>k</td></tr>
  <tr><td>...</td><td>...</td><td>...</td><td>...</td><td>...</td></tr>
</tbody>
</table>
