

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Menghasilkan pidato dari dokumen SSML
<a name="ssml"></a>

Anda dapat menggunakan Amazon Polly untuk menghasilkan ucapan dari teks biasa atau dari dokumen yang ditandai dengan Speech Synthesis Markup Language (SSML). Menggunakan teks yang disempurnakan SSML memberi Anda kontrol tambahan atas cara Amazon Polly menghasilkan ucapan dari teks yang Anda berikan.

Dengan tag SSML, Anda dapat menyesuaikan dan mengontrol aspek ucapan seperti pengucapan, volume, dan kecepatan bicara. Dalam Konsol Manajemen AWS, teks yang disempurnakan SSML yang ingin Anda konversi ke audio dimasukkan pada tab SSML halaman. Text-to-Speech Meskipun teks yang dimasukkan dalam teks biasa bergantung pada pengaturan default untuk bahasa dan suara yang Anda pilih, teks yang disempurnakan dengan SSML memberi tahu Amazon Polly tidak hanya apa yang ingin Anda katakan, tetapi bagaimana Anda ingin mengatakannya. Kecuali untuk tag SSML yang ditambahkan, Amazon Polly mensintesis teks yang disempurnakan SSML dengan cara yang sama seperti mensintesis teks biasa. Untuk informasi selengkapnya, lihat [Mensintesis pidato dengan contoh Amazon Polly](synthesize-example.md). 

Saat menggunakan SSML, Anda melampirkan seluruh teks dalam `<speak>` tag untuk memberi tahu Amazon Polly bahwa Anda menggunakan SSML. Contoh: 

```
<speak>Hi! My name is Joanna. I will read any text you type here.</speak>
```

Anda kemudian menggunakan tag SSML tertentu pada teks di dalam `<speak>` tag untuk menyesuaikan cara Anda ingin teks berbunyi. Anda dapat menambahkan jeda, mengubah kecepatan bicara, menurunkan atau menaikkan volume suara, atau menambahkan banyak penyesuaian lain sehingga teks terdengar tepat untuk Anda. Untuk daftar lengkap tag SSML yang dapat Anda gunakan, lihat. [Tag SSML yang didukung](supportedtags.md) 

Misalnya, Anda dapat menyertakan jeda panjang dalam teks Anda, atau mengubah kecepatan bicara atau nada. Pilihan lain termasuk:
+ menekankan kata atau frasa tertentu
+ menggunakan pengucapan fonetik
+ termasuk suara pernapasan
+ berbisik
+ menggunakan gaya berbicara penyiar berita.

Untuk detail selengkapnya tentang tag SSML yang didukung oleh Amazon Polly dan cara menggunakannya, lihat [Tag SSML yang didukung](supportedtags.md)

Saat menggunakan SSML, ada beberapa karakter yang dipesan yang memerlukan perlakuan khusus. Ini karena SSML menggunakan karakter ini sebagai bagian dari kodenya. Untuk menggunakannya, Anda menggunakan entitas tertentu untuk *menghindarinya*. Untuk informasi selengkapnya, lihat [Karakter yang dipesan di SSML](escapees.md)

Amazon Polly menyediakan jenis kontrol ini dengan subset tag markup SSML yang ditentukan oleh [Speech Synthesis Markup Language (SSML) Versi 1.1, Rekomendasi W3C](https://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/).

Anda dapat menggunakan SSML dalam konsol Amazon Polly atau dengan menggunakan. AWS CLI Topik berikut menunjukkan kepada Anda bagaimana Anda dapat menggunakan SSML untuk menghasilkan ucapan dan mengontrol output sehingga sesuai dengan kebutuhan Anda. 

**Topics**
+ [Karakter yang dipesan di SSML](escapees.md)
+ [Menggunakan SSML di konsol](ssml-to-speech-console.md)
+ [Menggunakan SSML dengan perintah Synthesize-Speech](example-ssml-synthesize-speech-cli.md)
+ [Mensintesis dokumen yang disempurnakan SSML](example-ssml-synthesize-document.md)
+ [Tag SSML yang didukung](supportedtags.md)

# Karakter yang dipesan di SSML
<a name="escapees"></a>

Ada lima karakter standar yang biasanya tidak dapat digunakan dalam pernyataan SSML. Entitas ini dicadangkan oleh spesifikasi bahasa. Karakter-karakter ini adalah sebagai berikut:


| Nama | Karakter | Kode melarikan diri | 
| --- | --- | --- | 
| tanda kutip (tanda kutip ganda) | " | “ | 
| ampersand | & | & | 
| tanda kutip atau tanda kutip tunggal | ' | ' | 
| kurang dari tanda | < | < | 
| lebih besar dari tanda | > | > | 

Karena SSML menggunakan karakter ini sebagai bagian dari kodenya, untuk menggunakan simbol-simbol ini di SSML, Anda harus *melarikan diri dari* karakter saat Anda menggunakannya. Anda menggunakan kode escape alih-alih karakter yang sebenarnya sehingga ditampilkan dengan benar sambil tetap membuat dokumen SSML yang valid. Misalnya, kalimat berikut

```
We're using the lawyer at Peabody & Chambers, attorneys-at-law.
```

akan dirender di SSML sebagai 

```
<speak>
We&apos;re using the lawyer at Peabody &amp; Chambers, attorneys-at-law.
</speak>
```

Dalam hal ini, karakter khusus untuk apostrof dan ampersand diloloskan sehingga dokumen SSML tetap valid.

Untuk simbol **&**, **<**, **dan>**, kode pelarian selalu diperlukan saat Anda menggunakan SSML. Selain itu, ketika Anda menggunakan tanda kutip apostrophe/tunggal (**'**) sebagai tanda kutip, Anda juga harus menggunakan kode escape.

Namun, ketika Anda menggunakan tanda kutip ganda (**"**), atau apostrophe/single tanda kutip (**'**) sebagai tanda kutip, maka apakah Anda menggunakan kode escape tergantung pada konteks.

Tanda kutip ganda 
+ Harus diloloskan ketika dalam nilai atribut dibatasi oleh tanda kutip ganda. Misalnya, dalam AWS CLI kode berikut 

  ```
  --text "Pete &quot;Maverick&quot; Mitchell"
  ```
+ Tidak perlu melarikan diri ketika dalam konteks tekstual. Misalnya, dalam hal berikut

  ```
  He said, "Turn right at the corner."
  ```
+ Tidak perlu diloloskan ketika dalam nilai atribut dibatasi oleh tanda kutip tunggal. Misalnya, dalam AWS CLI kode berikut 

  ```
  --text 'Pete "Maverick" Mitchell'
  ```

Tanda kutip tunggal 
+ Harus melarikan diri ketika digunakan sebagai tanda kutip. Misalnya, dalam hal berikut 

  ```
  We&apos;ve got to leave quickly.
  ```
+ Tidak perlu melarikan diri ketika dalam konteks tekstual. Misalnya, dalam hal berikut

  ```
  "And then I said, 'Don't quote me.'"
  ```
+ Tidak perlu diloloskan ketika dalam atribut kode dibatasi oleh tanda kutip ganda. Misalnya, dalam AWS CLI kode berikut 

  ```
  --text "Pete 'Maverick' Mitchell"
  ```

# Menggunakan SSML di konsol
<a name="ssml-to-speech-console"></a>

Dalam contoh berikut, Anda menggunakan tag SSML untuk memberi tahu Amazon Polly untuk mengganti “World Wide Web Consortium” dengan “W3C” ketika berbicara paragraf pendek. Anda juga menggunakan tag untuk memperkenalkan jeda dan membisikkan kata. Bandingkan hasil latihan ini dengan hasil latihan[Menerapkan leksikon (Synthesizing Speech)](managing-lexicons-console-synthesize-speech.md).

Untuk informasi lebih lanjut tentang SSML, dengan contoh, lihat. [Tag SSML yang didukung](supportedtags.md)

**Untuk mensintesis ucapan dari teks yang disempurnakan SSML (konsol)**



1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon Polly di. [https://console.aws.amazon.com/polly/](https://console.aws.amazon.com/polly/)

1. Jika belum ditampilkan, pilih tab **Text-to-Speech**. 

1. Nyalakan **SSML**.

1. Ketik atau tempel teks berikut di kotak teks: 

   ```
   <speak>
        He was caught up in the game.<break time="1s"/> In the middle of the 
        10/3/2014 <sub alias="World Wide Web Consortium">W3C</sub> meeting, 
        he shouted, "Nice job!" quite loudly. When his boss stared at him, he repeated 
        <amazon:effect name="whispered">"Nice job,"</amazon:effect> in a 
        whisper.
   </speak>
   ```

   Tag SSML memberi tahu Amazon Polly cara merender teks:
   + `<break time="1s"/>`memberitahu Amazon Polly untuk berhenti sejenak 1 detik antara dua kalimat pertama.
   + `<sub alias="World Wide Web Consortium">W3C</sub>`memberitahu Amazon Polly untuk menggantikan World Wide Web Consortium untuk akronim W3C.
   + `<amazon:effect name="whispered">Nice job</amazon:effect>`memberitahu Amazon Polly untuk membisikkan contoh kedua “Kerja bagus.”.
**catatan**  
Saat Anda menggunakan AWS CLI, Anda melampirkan teks input dalam tanda kutip untuk membedakannya dari kode sekitarnya. Konsol Amazon Polly tidak menampilkan kode kepada Anda, jadi Anda tidak menyertakan teks input dalam tanda kutip saat menggunakannya.

1. Untuk **Bahasa**, pilih **Inggris, AS**, lalu pilih suara.

1. Untuk mendengarkan pidato, pilih **Dengarkan**.

1. Untuk menyimpan file ucapan, pilih **Unduh**. Jika Anda ingin menyimpannya dalam format yang berbeda, perluas **Pengaturan tambahan**, aktifkan **Pengaturan format file ucapan** dan pilih format yang Anda inginkan, lalu pilih **Unduh**. 

# Menggunakan SSML dengan perintah Synthesize-Speech
<a name="example-ssml-synthesize-speech-cli"></a>

Contoh ini menunjukkan cara menggunakan `synthesize-speech` perintah dengan string SSML. Saat Anda menggunakan `synthesize-speech` perintah, Anda biasanya memberikan yang berikut:
+ Teks masukan (wajib) 
+ Membuka dan menutup tag (wajib)
+ Format output
+ Sebuah suara 

Dalam contoh ini, Anda menentukan string teks sederhana dalam tanda kutip bersama dengan `<speak></speak>` tag pembuka dan penutup yang diperlukan. 

**penting**  
Meskipun Anda tidak menggunakan tanda kutip di sekitar teks input di konsol Amazon Polly, Anda harus menggunakannya dalam menggunakan AWS CLI Penting juga bagi Anda untuk membedakan antara tanda kutip di sekitar teks input dan kutipan yang diperlukan untuk tag individual.  
Misalnya, Anda dapat menggunakan tanda kutip standar (“) untuk melampirkan teks input, dan tanda kutip tunggal (') untuk tag interior, atau sebaliknya. Opsi mana pun berfungsi untuk Unix, Linux, dan macOS. Namun, dengan Windows Anda harus melampirkan teks input dalam tanda kutip standar dan menggunakan tanda kutip tunggal untuk tag.   
Untuk semua sistem operasi, Anda dapat menggunakan tanda kutip standar (“) untuk melampirkan teks input, dan tanda kutip tunggal (') untuk tag interior). Contoh:  

```
--text "<speak>Hello <break time='300ms'/> World</speak>"
```
  
Untuk Unix, Linux, dan macOS, Anda juga dapat menggunakan kebalikannya, dengan tanda kutip tunggal (') yang melampirkan teks input dan tanda kutip standar (“) untuk tag interior:  

```
--text '<speak>Hello <break time="300ms"/> World</speak>'
```


 AWS CLI Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\$1) Unix di akhir setiap baris dengan tanda sisipan (^) dan gunakan tanda kutip penuh (“) di sekitar teks input dengan tanda kutip tunggal (') untuk tag interior.

```
aws polly synthesize-speech \
--text-type ssml \
--text '<speak>Hello world</speak>' \
--output-format mp3 \
--voice-id Joanna \
speech.mp3
```

Untuk mendengar pidato yang disintesis, putar `speech.mp3` file yang dihasilkan menggunakan pemutar audio apa pun.

# Mensintesis dokumen yang disempurnakan SSML
<a name="example-ssml-synthesize-document"></a>

Untuk teks input yang lebih panjang, Anda mungkin merasa lebih mudah untuk menyimpan konten SSML Anda ke file dan cukup tentukan nama file dalam perintah. `synthesize-speech` Misalnya Anda dapat menyimpan yang berikut ini ke file bernama`example.xml`:

```
<?xml version="1.0"?>
<speak version="1.1" 
       xmlns="http://www.w3.org/2001/10/synthesis"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
       xsi:schemaLocation="http://www.w3.org/2001/10/synthesis http://www.w3.org/TR/speech-synthesis11/synthesis.xsd"
       xml:lang="en-US">Hello World</speak>
```

`xml:lang`Atribut menentukan `en-US` (US English) sebagai bahasa dari teks input. Untuk informasi tentang bagaimana bahasa teks input dan bahasa suara yang dipilih memengaruhi `SynthesizeSpeech` operasi, lihat[Menentukan bahasa lain untuk kata-kata tertentu](lang-tag.md). 

**Untuk menjalankan file yang disempurnakan SSML**

1. Simpan SSML ke file (misalnya,`example.xml`).

1. Jalankan `synthesize-speech` perintah berikut dari jalur tempat file XHTML disimpan dan tentukan file SSML sebagai input dengan mengganti `file:\\example.xml` teks masukan. Karena perintah ini menunjuk ke file alih-alih berisi teks input yang sebenarnya, Anda tidak menggunakan tanda kutip.
**catatan**  
 AWS CLI Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\$1) Unix di akhir setiap baris dengan tanda sisipan (^).

   ```
   aws polly synthesize-speech \
   --text-type ssml \
   --text file://example.xml \
   --output-format mp3 \
   --voice-id Joanna \
   speech.mp3
   ```

1. Untuk mendengar pidato yang disintesis, putar `speech.mp3` file yang dihasilkan menggunakan pemutar audio apa pun.

# Tag SSML yang didukung
<a name="supportedtags"></a>

Semua tag kecuali `<amazon:domain name="news">` didukung untuk suara Standar. Ketersediaan tag untuk suara lain disediakan dalam tabel berikut.

Amazon Polly mendukung tag SSML berikut:


| Tindakan | Tag SSML | Ketersediaan suara saraf | Ketersediaan suara bentuk panjang | Ketersediaan suara generatif | 
| --- | --- | --- | --- | --- | 
|  [Menambahkan jeda](break-tag.md)  |  <break>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Menekankan kata-kata](emphasis-tag.md)  | <emphasis> |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Menentukan bahasa lain untuk kata-kata tertentu](lang-tag.md)  | <lang> |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Menempatkan tag khusus dalam teks Anda](custom-tag.md)  | <mark> |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan sebagian  | 
|  [Menambahkan jeda antar paragraf](p-tag.md)  |  <p>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Menggunakan pengucapan fonetik](phoneme-tag.md)  |  <phoneme>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan sebagian  | 
|  [Mengontrol volume, kecepatan berbicara, dan nada](prosody-tag.md)  |  <prosody>  |  Ketersediaan sebagian  |  Ketersediaan sebagian  |  Availiabilitas sebagian  | 
|  [Menetapkan durasi maksimum untuk ucapan yang disintesis](maxduration-tag.md)  |  <prosody amazon:max-duration>  |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Menambahkan jeda di antara kalimat](s-tag.md)  |  <s>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Mengontrol bagaimana jenis kata khusus diucapkan](say-as-tag.md)  |  <say-as>  |  Ketersediaan sebagian  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Mengidentifikasi teks yang disempurnakan SSML](speak-tag.md)  |  <speak>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Mengucapkan akronim dan singkatan](sub-tag.md)  |  <sub>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Meningkatkan pengucapan dengan menentukan bagian pidato](w-tag.md)  |  <w>  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Ketersediaan penuh  | 
|  [Menambahkan suara pernapasan](breath-tag.md)  |  <amazon:auto-breaths>  |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Gaya berbicara penyiar berita](newscaster-tag.md)  | <amazon:domain name="news"> |  Pilih suara saraf saja  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Menambahkan kompresi rentang dinamis](drc-tag.md)  |  <amazon:effect name="drc">  |  Ketersediaan penuh  |  Ketersediaan penuh  |  Tidak tersedia  | 
|  [Berbicara dengan lembut](phonation-tag.md)  |  <amazon:effect phonation="soft">  |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Mengontrol timbre](vocaltractlength-tag.md)  |  <amazon:efek> vocal-tract-length  |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 
|  [Berbisik](whispered-tag.md)  |  <amazon:effect name="whispered">  |  Tidak tersedia  |  Tidak tersedia  |  Tidak tersedia  | 

**catatan**  
Jika Anda menggunakan tag SSML yang tidak didukung dalam format standar, neural, atau bentuk panjang, Anda akan mendapatkan kesalahan. 

# Mengidentifikasi teks yang disempurnakan SSML
<a name="speak-tag"></a>

**<speak>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

`<speak>`Tag adalah elemen root dari semua teks Amazon Polly SSML. <speak>Semua teks yang disempurnakan SSML harus diapit dalam sepasang tag. 

```
<speak>Mary had a little lamb.</speak>
```



# Menambahkan jeda
<a name="break-tag"></a>

**<break>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

Untuk menambahkan jeda ke teks Anda, gunakan <break>tag. Anda dapat mengatur jeda berdasarkan kekuatan (setara dengan jeda setelah koma, kalimat, atau paragraf), atau Anda dapat mengaturnya ke jangka waktu tertentu dalam hitungan detik atau milidetik. Jika Anda tidak menentukan atribut untuk menentukan panjang jeda, Amazon Polly menggunakan default, `<break strength="medium"/>` yaitu, yang menambahkan jeda panjang jeda setelah koma.

`strength`nilai atribut:
+ `none`: Tidak ada jeda. Gunakan `none` untuk menghapus jeda yang biasanya terjadi, seperti setelah periode tertentu.
+ `x-weak`: Memiliki kekuatan yang sama dengan`none`, tidak ada jeda.
+ `weak`: Menetapkan jeda dengan durasi yang sama dengan jeda setelah koma.
+ `medium`: Memiliki kekuatan yang sama dengan`weak`.
+ `strong`: Menetapkan jeda dengan durasi yang sama dengan jeda setelah kalimat. 
+ `x-strong`: Menetapkan jeda dengan durasi yang sama dengan jeda setelah paragraf. 

`time`nilai atribut:
+ `[number]s`: Durasi jeda, dalam hitungan detik. Durasi maksimum adalah`10s`.
+ `[number]ms`: Durasi jeda, dalam milidetik. Durasi maksimum adalah`10000ms`.

Contoh:

```
<speak>
     Mary had a little lamb <break time="3s"/>Whose fleece was white as snow.
</speak>
```



Jika Anda tidak menggunakan atribut dengan `break` tag, hasilnya bervariasi tergantung pada teks:
+ Jika tidak ada tanda baca lain di sebelah `break` tag, itu akan membuat `<break strength="medium"/>` (jeda panjang koma).
+ Jika tag berada di sebelah koma, tag akan ditingkatkan menjadi `<break strength="strong"/>` (jeda panjang kalimat).
+ Jika tag berada di sebelah titik, tag akan ditingkatkan menjadi `<break strength="x-strong"/>` (jeda sepanjang paragraf).

**catatan**  
Saat `<break time=>` ini sebagian tersedia untuk suara Generatif. `<break>`dan `<break strength=>` didukung penuh untuk suara Generatif.



# Menekankan kata-kata
<a name="emphasis-tag"></a>

**<emphasis>

Tag ini hanya didukung oleh format TTS standar.

Untuk menekankan kata-kata, gunakan <emphasis>tag. Menekankan kata-kata mengubah kecepatan dan volume berbicara. Penekanan yang lebih besar membuat Amazon Polly berbicara teks lebih keras dan lebih lambat. Kurang penekanan membuatnya berbicara lebih tenang dan lebih cepat. Untuk menentukan tingkat penekanan, gunakan `level` atribut.

`level`nilai atribut:
+ `Strong`: Meningkatkan volume dan memperlambat kecepatan berbicara sehingga pidato lebih keras dan lebih lambat.
+ `Moderate`: Meningkatkan volume dan memperlambat kecepatan berbicara, tetapi kurang dari`strong`. `Moderate`adalah default. 
+ `Reduced`: Mengurangi volume dan mempercepat kecepatan berbicara. Pidato lebih lembut dan lebih cepat.

**catatan**  
Tingkat dan volume berbicara normal untuk suara jatuh di antara `reduced` level `moderate` dan.

Contoh:

```
<speak>I already told you I <emphasis level="strong">really like</emphasis> that person.</speak>
```



# Menentukan bahasa lain untuk kata-kata tertentu
<a name="lang-tag"></a>

**<lang>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar. Untuk suara generatif, `<lang>` tag hanya dapat digunakan di sekitar kalimat lengkap.

Tentukan bahasa lain untuk kata, frasa, atau kalimat tertentu dengan <lang>tag. Kata-kata dan frasa bahasa asing umumnya diucapkan lebih baik ketika mereka tertutup dalam sepasang `<lang>` tag. Untuk menentukan bahasa, gunakan `xml:lang` atribut. Untuk daftar lengkap bahasa yang tersedia, lihat[Bahasa di Amazon Polly](supported-languages.md).

 Kecuali Anda menerapkan `<lang>` tag, semua kata dalam teks input diucapkan dalam bahasa suara yang ditentukan dalam`voice-id`. Jika Anda menerapkan `<lang>` tag, kata-kata diucapkan dalam bahasa itu. 



Misalnya, jika `voice-id` adalah Joanna (yang berbicara bahasa Inggris AS), Amazon Polly berbicara yang berikut dengan suara Joanna tanpa aksen Prancis:

```
<speak>
     Je ne parle pas français.
</speak>
```



Jika Anda menggunakan suara Joanna dengan `<lang>` tag, Amazon Polly mengucapkan kalimat dalam suara Joanna dalam bahasa Prancis beraksen Amerika:

```
<speak>
     <lang xml:lang="fr-FR">Je ne parle pas français.</lang>.
</speak>
```



Karena Joanna bukan suara asli Prancis, pengucapan didasarkan pada bahasa ibunya, Inggris AS. Misalnya, meskipun pengucapan bahasa Prancis yang sempurna menampilkan getaran uvual /R/dalam kata *français*, suara Inggris AS Joanna mengucapkan fonem ini sebagai suara yang sesuai/r/. 

Jika Anda menggunakan Giorgio, yang berbicara bahasa Italia, dengan teks berikut, Amazon Polly mengucapkan kalimat dalam suara Giorgio dengan pengucapan Italia: `voice-id` 

```
<speak>
     Mi piace Bruce Springsteen.
</speak>
```



Jika Anda menggunakan suara yang sama dengan `<lang>` tag berikut, Amazon Polly mengucapkan Bruce Springsteen dalam bahasa Inggris beraksen Italia: 

```
<speak>
     Mi piace <lang xml:lang="en-US">Bruce Springsteen.</lang>
</speak>
```

Tag ini juga dapat digunakan sebagai pengganti [DefaultLangCode](API_StartSpeechSynthesisTask.html#polly-StartSpeechSynthesisTask-request-DefaultLangCode)opsi opsional saat mensintesis ucapan. Namun, melakukan hal itu mengharuskan Anda memformat teks Anda menggunakan SSML.



# Menempatkan tag khusus dalam teks Anda
<a name="custom-tag"></a>

**<mark>

Tag ini didukung oleh format TTS bentuk panjang, saraf, dan standar. Tag ini tidak melakukan apa pun untuk suara generatif karena tanda pidato tidak tersedia untuk suara generatif.

Untuk menempatkan tag kustom dalam teks, gunakan <mark>tag. Amazon Polly tidak mengambil tindakan pada tag, tetapi mengembalikan lokasi tag dalam metadata SSML. Tag ini dapat berupa apa saja yang ingin Anda panggil, asalkan mempertahankan format berikut:

```
<mark name="tag_name"/>
```

 Misalnya, misalkan nama tag adalah “hewan” dan teks inputnya adalah:

```
<speak>
     Mary had a little <mark name="animal"/>lamb.
</speak>
```

Amazon Polly mungkin mengembalikan metadata SSML berikut: 

```
{"time":767,"type":"ssml","start":25,"end":46,"value":"animal"}
```



# Menambahkan jeda antar paragraf
<a name="p-tag"></a>

**<p>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

<p>Untuk menambahkan jeda di antara paragraf dalam teks Anda, gunakan tag. Menggunakan tag ini memberikan jeda yang lebih lama daripada penutur asli biasanya menempatkan pada koma atau akhir kalimat. Gunakan <p>tag untuk melampirkan paragraf:

```
<speak>
     <p>This is the first paragraph. There should be a pause after this text is spoken.</p> 
     <p>This is the second paragraph.</p> 
</speak>
```

Ini setara dengan menentukan jeda menggunakan. <break strength="x-strong"/>



# Menggunakan pengucapan fonetik
<a name="phoneme-tag"></a>

**<phoneme>

Tag ini didukung oleh format TTS bentuk panjang, saraf, dan standar.

<phoneme>Untuk membuat Amazon Polly menggunakan pengucapan fonetik untuk teks tertentu, gunakan tag. 

Dua atribut diperlukan dengan `<phoneme>` tag. Mereka menunjukkan alfabet fonetik yang digunakan Amazon Polly dan simbol fonetik dari pengucapan yang dikoreksi: 
+ `alphabet` 
  +  `ipa`— Menunjukkan bahwa Alfabet Fonetik Internasional (IPA) akan digunakan. 
  +  `x-sampa`— Menunjukkan bahwa Metode Penilaian Pidato Diperpanjang Alfabet Fonetik (X-SAMPA) akan digunakan.
+ `ph` 
  + Menentukan simbol fonetik untuk pengucapan. Untuk informasi selengkapnya, lihat [Bahasa di Amazon Polly](supported-languages.md)

Dengan `<phoneme>` tag, Amazon Polly menggunakan pengucapan yang ditentukan oleh `ph` atribut, bukan pengucapan standar yang dikaitkan secara default dengan bahasa yang digunakan oleh suara yang dipilih.

Misalnya, kata “kemiri” dapat diucapkan dengan dua cara. Dalam contoh berikut, “kemiri” diberikan pengucapan yang berbeda di setiap baris. Amazon Polly mengucapkan kemiri seperti yang ditentukan dalam `ph` atribut, alih-alih menggunakan pengucapan default.

Alfabet Fonetik Internasional (IPA)

```
<speak>
     You say, <phoneme alphabet="ipa" ph="pɪˈkɑːn">pecan</phoneme>. 
     I say, <phoneme alphabet="ipa" ph="ˈpi.kæn">pecan</phoneme>.
</speak>
```

Metode Penilaian Pidato Diperpanjang Alfabet Fonetik (X-SAMPA)

```
<speak>
     You say, <phoneme alphabet='x-sampa' ph='pI"kA:n'>pecan</phoneme>.
     I say, <phoneme alphabet='x-sampa' ph='"pi.k{n'>pecan</phoneme>. 
</speak>
```

 Mandarin Mandarin menggunakan Pinyin untuk pengucapan fonetik..

Pinyin

```
<speak>
     你说 <phoneme alphabet="x-amazon-pinyin" ph="bo2">薄</phoneme>。 
     我说 <phoneme alphabet="x-amazon-pinyin" ph="bao2">薄</phoneme>。
</speak>
```

Bahasa Jepang menggunakan Yomigana dan Pengucapan Kana.

Yomigana

```
<speak>
     名前は<phoneme alphabet="x-amazon-yomigana" ph="ひろかず">浩一</phoneme>です。
     名前は<phoneme alphabet="x-amazon-yomigana" ph="ヒロカズ">浩一</phoneme>です。
     名前は<phoneme alphabet="x-amazon-yomigana" ph="Hirokazu">浩一</phoneme>です。
</speak>
```

Pengucapan Kana

```
<speak>
     名前は<phoneme alphabet="x-amazon-pron-kana" ph="ヒロ'カズ">浩一</phoneme>です。
</speak>
```

# Mengontrol volume, kecepatan berbicara, dan nada
<a name="prosody-tag"></a>

**<prosody>

Atribut tag prosody sepenuhnya didukung oleh suara TTS standar. Suara generatif, Neural, dan Bentuk Panjang mendukung `rate` atribut `volume` dan, tetapi tidak mendukung atribut. `pitch` Untuk suara Generatif, tag prosodi hanya dapat digunakan di sekitar kalimat lengkap.

Untuk mengontrol volume, kecepatan, atau nada suara yang Anda pilih, gunakan `prosody` tag.

Volume, kecepatan bicara, dan nada tergantung pada suara tertentu yang dipilih. Selain perbedaan antara suara untuk bahasa yang berbeda, ada perbedaan antara suara individu yang berbicara dalam bahasa yang sama. Karena itu, meskipun atribut serupa di semua bahasa, ada variasi yang jelas dari bahasa ke bahasa dan tidak ada nilai absolut yang tersedia. 

`prosody`Tag memiliki tiga atribut, masing-masing memiliki beberapa nilai yang tersedia untuk mengatur atribut. Setiap atribut menggunakan sintaks yang sama:

```
<prosody attribute="value"></prosody>
```


+ `volume`
  + `default`: Mengatur ulang volume ke level default untuk suara saat ini.
  + `silent`,`x-soft`,`soft`, `medium``loud`,`x-loud`: Mengatur volume ke nilai yang telah ditentukan untuk suara saat ini. 
  + `+ndB`,`-ndB`: Mengubah volume relatif terhadap level saat ini. Nilai `+0dB` berarti tidak ada perubahan, `+6dB` berarti kira-kira dua kali volume saat ini, dan `-6dB` berarti sekitar setengah volume saat ini.

  Misalnya, Anda dapat mengatur volume untuk suatu bagian sebagai berikut:

  ```
  <speak>
       Sometimes it can be useful to <prosody volume="loud">increase the volume 
       for a specific speech.</prosody>                     
  </speak>
  ```

  Atau Anda bisa mengaturnya dengan cara ini:

  ```
  <speak>
       And sometimes a lower volume <prosody volume="-6dB">is a more effective way of 
       interacting with your audience.</prosody>  
  </speak>
  ```
+ `rate`
  +  `x-slow`,`slow`,`medium`,`fast`,`x-fast`. Menetapkan pitch ke nilai yang telah ditentukan untuk suara yang dipilih.
  + `n%`: Persentase perubahan non-negatif dalam tingkat berbicara. Misalnya, nilai 100% berarti tidak ada perubahan dalam tingkat berbicara, nilai 200% berarti tingkat berbicara dua kali tingkat default, dan nilai 50% berarti tingkat berbicara setengah dari tingkat default. Nilai ini memiliki kisaran 20-200%.

  Misalnya, Anda dapat mengatur kecepatan bicara untuk suatu bagian sebagai berikut:

  ```
  <speak>
       For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking 
       rate of your text.</prosody>                     
  </speak>
  ```

  Atau Anda bisa mengaturnya dengan cara ini:

  ```
  <speak>
       Although in some cases, it might help your audience to <prosody rate="85%">slow 
       the speaking rate slightly to aid in comprehension.</prosody>  
  </speak>
  ```
+ `pitch`
  + `default`: Mengatur ulang pitch ke level default untuk suara saat ini.
  + `x-low`,`low`,`medium`,`high`,`x-high`: Mengatur pitch ke nilai yang telah ditentukan untuk suara saat ini. 
  + `+n%`atau`-n%`: Menyesuaikan pitch dengan persentase relatif. Misalnya, nilai `+0%` berarti tidak ada perubahan nada dasar, `+5%` memberikan nada dasar yang sedikit lebih tinggi, dan `-5%` menghasilkan nada dasar yang sedikit lebih rendah.

  Misalnya, Anda dapat mengatur pitch untuk suatu bagian sebagai berikut:

  ```
  <speak>
       Do you like sythesized speech <prosody pitch="high">with a pitch that is higher 
       than normal?</prosody>                     
  </speak>
  ```

  Atau Anda bisa mengaturnya dengan cara ini:

  ```
  <speak>
       Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody>  
  </speak>
  ```

<prosody>Tag harus berisi setidaknya satu atribut, tetapi dapat menyertakan lebih banyak dalam tag yang sama. 

```
<speak>
     Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak  
     quite slowly and deliberately until I have my coffee.</prosody>
</speak>
```

Itu juga dapat dikombinasikan dengan tag bersarang, sebagai berikut:

```
<speak>
     <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can 
     change the impression your audience has of a voice</prosody> as well.</prosody>                  
</speak>
```

**catatan**  
Saat `<prosody>` ini sebagian tersedia untuk suara Generatif.



# Menetapkan durasi maksimum untuk ucapan yang disintesis
<a name="maxduration-tag"></a>

**<prosody amazon:max-duration>

Tag ini saat ini hanya didukung oleh format TTS standar.

Untuk mengontrol berapa lama Anda ingin pidato untuk mengambil ketika itu disintesis, gunakan `<prosody>` tag dengan `amazon:max-duration` atribut.

Durasi ucapan yang disintesis sedikit berbeda, tergantung pada suara yang Anda pilih. Hal ini dapat membuat sulit untuk mencocokkan ucapan yang disintesis dengan visual atau aktivitas lain yang membutuhkan waktu yang tepat. Masalah ini diperbesar untuk aplikasi terjemahan karena waktu yang diperlukan untuk mengucapkan frasa tertentu dapat sangat bervariasi dengan bahasa yang berbeda.

`<prosody amazon:max-duration>`Tag mencocokkan ucapan yang disintesis dengan jumlah waktu yang Anda inginkan (durasi). 

Tag ini menggunakan sintaks berikut:

```
<prosody amazon:max-duration="time duration">
```

Dengan `<prosody amazon:max-duration>` tag, Anda dapat menentukan durasi dalam detik atau milidetik:
+ `ns`: durasi maksimum dalam hitungan detik
+ `nms`: durasi maksimum dalam milidetik

Misalnya, teks lisan berikut memiliki durasi maksimum 2 detik: 

```
<speak>
     <prosody amazon:max-duration="2s">
          Human speech is a powerful way to communicate. 
     </prosody>
</speak>
```

Teks ditempatkan di dalam tag, itu tidak melebihi durasi yang ditentukan. Jika suara atau bahasa yang dipilih biasanya memakan waktu lebih lama dari durasi itu, Amazon Polly mempercepat pembicaraan sehingga sesuai dengan durasi yang ditentukan. 

Jika durasi yang ditentukan lebih lama dari yang diperlukan untuk membaca teks dengan kecepatan normal, Amazon Polly membaca pidato secara normal. Itu tidak memperlambat pidato atau menambah keheningan, sehingga audio yang dihasilkan lebih pendek dari yang diminta. 

**catatan**  
Amazon Polly meningkatkan kecepatan tidak lebih dari 5 kali tingkat normal. Jika teks diucapkan lebih cepat dari ini, biasanya tidak masuk akal. Jika pidato tidak sesuai dengan durasi yang Anda tentukan bahkan ketika dipercepat hingga maksimum, audio akan dipercepat tetapi akan bertahan lebih lama dari durasi yang ditentukan.

Anda dapat menyertakan satu kalimat atau beberapa kalimat dalam sebuah `<prosody amazon:max-duration>` tag, dan Anda dapat menggunakan beberapa `<prosody amazon:max-duration>` tag dalam teks Anda.

Contoh:

```
<speak>
     <prosody amazon:max-duration="2400ms">
        Human speech is a powerful way to communicate.
     </prosody>
     <break strength="strong"/>
     <prosody amazon:max-duration="5100ms">
        Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
     </prosody>
     <break strength="strong"/>
     <prosody amazon:max-duration="8900ms">
        We naturally understand this information, which is why speech is ideal for creating applications where 
        a screen isn’t practical or possible, or simply isn’t convenient.
     </prosody>
</speak>
```



```
```

Menggunakan `<prosody amazon:max-duration>` tag dapat meningkatkan latensi saat Amazon Polly mengembalikan ucapan yang disintesis. Tingkat latensi tergantung pada bagian dan panjangnya. Sebaiknya gunakan teks yang terdiri dari bagian teks yang relatif pendek. 

**Batasan**

Ada batasan baik dalam cara Anda menggunakan `<prosody amazon:max-duration>` tag dan cara kerjanya dengan tag SSML lainnya:
+ Teks di dalam `<prosody amazon:max-duration>` tag tidak boleh lebih dari 1500 karakter. 
+ Anda tidak dapat membuat `<prosody amazon:max-duration>` tag sarang. Jika Anda menempatkan satu `<prosody amazon:max-duration>` tag di dalam tag lain, Amazon Polly mengabaikan tag batin.

  Misalnya, berikut ini, `<prosody amazon:max-duration="5s">` tag diabaikan:

  ```
  <speak>
       <prosody amazon:max-duration="16s">
            Human speech is a powerful way to communicate.
          
            <prosody amazon:max-duration="5s">
                 Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
            </prosody>
  
            We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient.
       </prosody>
  </speak>
  ```
+ Anda tidak dapat menggunakan `<prosody>` tag dengan `rate` atribut dalam `<prosody amazon:max-duration>` tag. Ini karena keduanya mempengaruhi kecepatan di mana teks diucapkan. 

  Dalam contoh berikut, Amazon Polly mengabaikan tag: `<prosody rate="2">`

  ```
  <speak>
       <prosody amazon:max-duration="7500ms">
            Human speech is a powerful way to communicate.
        
            <prosody rate="2">
                 Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
            </prosody>
       </prosody>
  </speak>
  ```

**Jeda dan `max-duration`**

Saat menggunakan `max-duration` tag, Anda masih dapat menyisipkan jeda dalam teks Anda. Namun, Amazon Polly menyertakan panjang jeda saat menghitung durasi maksimum untuk berbicara. Selain itu, Amazon Polly mempertahankan jeda singkat yang terjadi di mana koma dan titik ditempatkan dalam suatu bagian dan termasuk dalam durasi maksimum.

Misalnya, di blok berikut, jeda 600 milidetik dan jeda yang disebabkan oleh koma dan periode terjadi dalam pidato 8 detik:

```
<speak>
     <prosody amazon:max-duration="8s">
          Human speech is a powerful way to communicate.
          <break time="600ms"/>
          Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
     </prosody>
</speak>
```



# Menambahkan jeda di antara kalimat
<a name="s-tag"></a>

**<s>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

Untuk menambahkan jeda di antara baris atau kalimat dalam teks Anda, gunakan `<s>` tag. Menggunakan tag ini memiliki efek yang sama seperti:
+ Mengakhiri kalimat dengan titik (.)
+ Menentukan jeda dengan `<break strength="strong"/>`

Berbeda `<break>` dengan tag, <s>tag melampirkan kalimat. Ini berguna untuk mensintesis pidato yang diatur dalam baris, bukan kalimat, seperti puisi.

Dalam contoh berikut, `<s>` tag membuat jeda singkat setelah kalimat pertama dan kedua. Kalimat terakhir tidak memiliki `<s>` tag, tetapi juga diikuti oleh jeda singkat karena berakhir dengan titik.

```
<speak>
     <s>Mary had a little lamb</s> 
     <s>Whose fleece was white as snow</s> 
     And everywhere that Mary went, the lamb was sure to go.
</speak>
```



# Mengontrol bagaimana jenis kata khusus diucapkan
<a name="say-as-tag"></a>

**<say-as>

 `<say-as>`Tag ini didukung oleh mesin TTS generatif, bentuk panjang, saraf, dan standar. Namun, perhatikan bahwa jika Amazon Polly menggunakan suara saraf dan menemukan `<say-as>` tag dengan `characters` opsi saat runtime, kalimat yang terpengaruh akan disintesis menggunakan suara standar terkait. Namun, kalimat yang terpengaruh akan tetap ditagih seolah-olah menggunakan suara saraf. 

Gunakan `<say-as>` tag dengan `interpret-as` atribut untuk memberi tahu Amazon Polly cara mengucapkan karakter, kata, dan angka tertentu. Ini memungkinkan Anda memberikan konteks tambahan untuk menghilangkan ambiguitas apa pun tentang bagaimana Amazon Polly harus merender teks.

`<say-as>`Tag menggunakan satu atribut`interpret-as`, yang menggunakan sejumlah kemungkinan nilai yang tersedia. Masing-masing menggunakan sintaks yang sama:

```
<say-as interpret-as="value">[text to be interpreted]</say-as>
```

Nilai-nilai berikut tersedia dengan`interpret-as`:
+ `characters`atau`spell-out`: Mengeja setiap huruf teks, seperti dalam a-b-c.
**catatan**  
Opsi ini saat ini tidak didukung untuk suara saraf. Jika Anda menggunakan suara saraf dan kode SSML ini ditemui oleh Amazon Polly saat run-time, kalimat yang terpengaruh akan disintesis menggunakan suara standar terkait. Harap dicatat, bagaimanapun, bahwa kalimat ini masih akan ditagih seolah-olah menggunakan suara saraf.
+ `cardinal`atau`number`: Menafsirkan teks numerik sebagai angka kardinal, seperti pada 1.234.
+ `ordinal`: Menafsirkan teks numerik sebagai nomor urut, seperti pada 1.234. 
+ `digits`: Jabarkan setiap digit secara individual, seperti pada 1-2-3-4. 
+ `fraction`: Menafsirkan teks numerik sebagai pecahan. Ini bekerja untuk kedua fraksi umum seperti 3/20, dan pecahan campuran, seperti 2 ½. Lihat di bawah untuk informasi lebih lanjut.
+ `unit`: Menafsirkan teks numerik sebagai pengukuran. Nilai harus berupa angka atau pecahan diikuti oleh unit tanpa spasi di antara seperti di`1/2inch`, atau hanya dengan unit, seperti dalam`1meter`.
+ `date`: Menafsirkan teks sebagai tanggal. Format tanggal harus ditentukan dengan atribut format. Lihat di bawah untuk informasi lebih lanjut.
+ `time`: Menafsirkan teks numerik sebagai durasi, dalam menit dan detik, seperti dalam. `1'21"` 
+ `address`: Menafsirkan teks sebagai bagian dari alamat jalan. 
+ `expletive`: “Bunyi bip” konten yang disertakan dalam tag. 
+ `telephone`: Menafsirkan teks numerik sebagai nomor telepon 7 digit atau 10 digit, seperti dalam. `2025551212` Anda juga dapat menggunakan nilai ini untuk menangani ekstensi telepon, seperti dalam`2025551212x345`. Lihat di bawah untuk informasi lebih lanjut.
**catatan**  
Saat ini `telephone` opsi tidak tersedia untuk semua bahasa. Namun, tersedia untuk suara yang berbicara varian bahasa Inggris (en-AU, en-GB, en-in, en-US, dan), varian bahasa Spanyol (es-ES, es-MX, dan es-US en-GB-WLS), varian bahasa Prancis (fr-fr dan fr-CA), dan varian Portugis (Pt-BR dan Pt-PT), serta Jerman (de-de), Italia (IT-it), Jepang (Ja-jp), dan Rusia (Ru-ru). Perlu juga dicatat bahwa dalam beberapa kasus, bahasa seperti Arab (arb) secara otomatis menangani nomor yang ditetapkan sebagai nomor telepon sehingga tidak benar-benar menerapkan tag `telephone` SSML.

**Pecahan**

Amazon Polly menafsirkan nilai dalam `say-as` tag yang memiliki `interpret-as="fraction"` atribut sebagai pecahan umum. Berikut ini adalah sintaks untuk pecahan:
+ *Pecahan*

  Sintaks:*cardinal number*/*cardinal number*, seperti 2/9.

  Misalnya: `<say-as interpret-as="fraction">2/9</say-as>` diucapkan “dua kesembilan.”
+ *Nomor Campuran Non-Negatif*

  Sintaks: *cardinal number* \$1*cardinal number*/*cardinal number*, seperti 3\$11/2. 

  Misalnya, `<say-as interpret-as="fraction">3+1/2</say-as>` diucapkan “tiga setengah.”
**catatan**  
Harus ada `+` antara “3" dan “1/2". Amazon Polly tidak mendukung angka campuran tanpa`+`, seperti “3 1/2".

**Tanggal**

Kapan `interpret-as` diatur ke`date`, Anda juga perlu menunjukkan format tanggal. 

Ini menggunakan sintaks berikut:

```
<say-as interpret-as="date" format="format">[date]</say-as>
```

Contoh:

```
<speak>
     I was born on <say-as interpret-as="date" format="mdy">12-31-1900</say-as>.
</speak>
```

Format berikut dapat digunakan dengan `date` atribut.
+ `mdy`: Month-day-year.
+ `dmy`: Day-month-year.
+ `ymd`: Year-month-day.
+ `md`: Bulan-hari.
+ `dm`: Hari-bulan.
+ `ym`: Tahun-bulan.
+ `my`: Bulan-tahun.
+ `d`: Hari.
+ `m`: Bulan.
+ `y`: Tahun.
+ `yyyymmdd`: Year-month-day. Jika Anda menggunakan format ini, Anda dapat membuat Amazon Polly melewati sebagian tanggal menggunakan tanda tanya. 

  Misalnya, Amazon Polly merender yang berikut ini sebagai “22 September”:

  ```
  <say-as interpret-as="date">????0922</say-as>
  ```

   `Format`tidak diperlukan.

**Telepon**

Amazon Polly mencoba menafsirkan teks yang Anda berikan dengan benar berdasarkan pemformatan teks bahkan tanpa tag. `<say-as>` Misalnya, jika teks Anda menyertakan “202-555-1212,” Amazon Polly menafsirkannya sebagai nomor telepon 10 digit dan mengatakan setiap digit satu per satu, dengan jeda singkat untuk setiap tanda hubung. Dalam hal ini, Anda tidak perlu menggunakannya`<say-as interpret-as="telephone">`. Namun, jika Anda memberikan teks “2025551212" dan ingin Amazon Polly mengatakannya sebagai nomor telepon, Anda akan menentukan. `<say-as interpret-as="telephone">`

Logika untuk menafsirkan setiap elemen adalah spesifik bahasa. Misalnya, bahasa Inggris AS dan Inggris berbeda dalam cara nomor telepon diucapkan (dalam bahasa Inggris Inggris, urutan digit yang sama dikelompokkan bersama, seperti dalam “lima ganda” atau “tiga empat”). Untuk melihat perbedaannya, uji contoh berikut dengan suara AS dan dengan suara Inggris: 

```
<speak>
     Richard's number is <say-as interpret-as="telephone">2122241555</say-as>
</speak>
```



# Mengucapkan akronim dan singkatan
<a name="sub-tag"></a>

**<sub>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

Gunakan `<sub>` tag dengan `alias` atribut untuk menggantikan kata yang berbeda (atau pengucapan) untuk teks yang dipilih seperti akronim atau singkatan.

Ini menggunakan sintaks:

```
<sub alias="new word">abbreviation</sub>
```

 Dalam contoh berikut, nama “Merkurius” diganti dengan simbol kimia elemen untuk membuat konten audio lebih jelas.

```
<speak>
     My favorite chemical element is <sub alias="Mercury">Hg</sub>, because it looks so shiny. 
</speak>
```



# Meningkatkan pengucapan dengan menentukan bagian pidato
<a name="w-tag"></a>

**<w>

Tag ini didukung oleh format TTS generatif, bentuk panjang, saraf, dan standar.

Anda dapat menggunakan <w>tag untuk menyesuaikan pengucapan kata-kata dengan menentukan bagian kata dari ucapan atau makna alternatif. Ini dilakukan dengan menggunakan `role` atribut.

Tag ini menggunakan sintaks berikut: 

```
<w role="attribute">text</w>
```

Nilai-nilai berikut dapat digunakan untuk `role` atribut:

Untuk menentukan bagian pidato:
+ `amazon:VB`: menafsirkan kata sebagai kata kerja (present simple).
+ `amazon:VBD`: menafsirkan kata sebagai kata kerja past tense.
+ `amazon:DT`: menafsirkan kata sebagai penentu.
+ `amazon:IN`: menafsirkan kata sebagai preposisi.
+ `amazon:JJ`: menafsirkan kata sebagai kata sifat.
+ `amazon:NN`: menafsirkan kata sebagai kata benda.

Misalnya, tergantung pada bagian pidatonya, pengucapan bahasa Inggris AS dari kata “baca” bervariasi berdasarkan tag:

```
<speak>
     The word <say-as interpret-as="characters">read</say-as> may be interpreted 
     as either the present simple form <w role="amazon:VB">read</w>, or the past 
     participle form <w role="amazon:VBD">read</w>.
</speak>
```

Untuk menentukan arti tertentu:
+ `amazon:DEFAULT`: menggunakan arti kata default.
+ `amazon:SENSE_1`: menggunakan arti kata non-default saat hadir. Misalnya, kata benda “bass” diucapkan berbeda tergantung pada artinya. Arti default adalah bagian terendah dari rentang musik. Arti alternatifnya adalah spesies ikan air tawar, juga disebut “bass” tetapi diucapkan berbeda. Menggunakan `<w role="amazon:SENSE_1">bass</w>` render pengucapan non-default (freshwater fish) untuk teks audio.

Perbedaan pengucapan dan makna ini dapat didengar jika Anda mensintesis yang berikut:

```
<speak>
    Depending on your meaning, the word <say-as interpret-as="characters">bass</say-as> 
    may be interpreted as either a musical element: bass, or as its alternative meaning, 
    a freshwater fish <w role="amazon:SENSE_1">bass</w>.
</speak>
```

**catatan**  
 Beberapa bahasa mungkin memiliki pilihan yang berbeda dari bagian pidato yang didukung. 

# Menambahkan suara pernapasan
<a name="breath-tag"></a>

*dan* <amazon:breath><amazon:auto-breaths>

Tag ini hanya didukung oleh format TTS standar.

Pidato yang terdengar alami mencakup kata-kata yang diucapkan dengan benar dan suara pernapasan. Dengan menambahkan suara pernapasan ke ucapan yang disintesis, Anda dapat membuatnya terdengar lebih alami. `<amazon:auto-breaths>`Tag `<amazon:breath>` dan memberikan napas. Anda memiliki opsi berikut: 
+  Mode manual: Anda mengatur lokasi, panjang, dan volume suara napas dalam teks
+  Mode otomatis: Amazon Polly secara otomatis memasukkan suara pernapasan ke output ucapan
+  Mode campuran: Anda dan Amazon Polly menambahkan suara pernapasan 

**Mode Manual**  
Dalam mode manual, Anda menempatkan `<amazon:breath/>` tag di teks input di mana Anda ingin mencari nafas. Anda dapat menyesuaikan panjang dan volume napas dengan `volume` atribut `duration` dan masing-masing: 


+ `duration`: Mengontrol panjang nafas. Nilai yang valid adalah:`default`,`x-short`,`short`,`medium`,`long`,`x-long`. Nilai default-nya adalah `medium`. 
+ `volume`: Mengontrol seberapa keras suara pernapasan. Nilai yang valid adalah:`default`,`x-soft`,`soft`,`medium`,`loud`,`x-loud`. Nilai default-nya adalah `medium`. 

**catatan**  
Panjang dan volume yang tepat dari setiap nilai atribut bergantung pada suara Amazon Polly tertentu yang digunakan.

Untuk mengatur suara napas menggunakan default, gunakan `<amazon:breath/>` tanpa atribut. 

Misalnya, untuk menggunakan atribut untuk mengatur durasi dan volume untuk napas ke medium, Anda akan mengatur atribut sebagai berikut: 

```
<speak>
     Sometimes you want to insert only <amazon:breath duration="medium" volume="x-loud"/>a single breath.
</speak>
```

Untuk menggunakan default, Anda hanya akan menggunakan tag:

```
<speak>
     Sometimes you need <amazon:breath/>to insert one or more average breaths <amazon:breath/> so that the 
     text sounds correct.
</speak>
```

Anda dapat menambahkan suara pernapasan individu dalam suatu bagian, sebagai berikut: 

```
<speak>
     <amazon:breath duration="long" volume="x-loud"/> <prosody rate="120%"> <prosody volume="loud"> 
     Wow! <amazon:breath duration="long" volume="loud"/> </prosody> That was quite fast. <amazon:breath 
     duration="medium" volume="x-loud"/> I almost beat my personal best time on this track. </prosody>
</speak>
```

**Mode Otomatis**  
Dalam mode otomatis, Anda menggunakan `<amazon:auto-breaths>` tag untuk memberi tahu Amazon Polly agar secara otomatis membuat suara pernapasan pada interval yang sesuai. Anda dapat mengatur frekuensi interval, volumenya, dan durasinya. Tempatkan `</amazon:auto-breaths>` tag di awal teks yang ingin Anda terapkan pernapasan otomatis dan kemudian tutup tag di bagian akhir. 

**catatan**  
Berbeda dengan tag mode manual`<amazon:breath/>`, `<amazon:auto-breaths>` tag memerlukan tag penutup (`</amazon:auto-breaths>`). 

Anda dapat menggunakan atribut opsional berikut dengan `<amazon:auto-breaths>` tag: 
+ `volume`: Mengontrol seberapa keras suara pernapasan. Nilai yang valid adalah:`default`,`x-soft`,`soft`,`medium`,`loud`,`x-loud`. Nilai default-nya adalah `medium`.
+ `frequency`: Mengontrol seberapa sering suara pernapasan terjadi dalam teks. Nilai yang valid adalah:`default`,`x-low`,`low`,`medium`,`high`,`x-high`. Nilai default-nya adalah `medium`.
+ `duration`: Mengontrol panjang nafas. Nilai yang valid adalah:`default`,`x-short`,`short`,`medium`,`long`,`x-long`. Nilai default-nya adalah `medium`. 

Secara default, frekuensi suara pernapasan tergantung pada teks input. Namun, suara pernapasan sering terjadi setelah koma dan menstruasi. 

Contoh berikut menunjukkan cara menggunakan `<amazon:auto-breaths>` tag. Untuk memutuskan opsi mana yang akan digunakan untuk konten Anda, salin contoh yang berlaku ke konsol Amazon Polly dan dengarkan perbedaannya. 
+  Menggunakan mode otomatis tanpa parameter opsional. 

  ```
  <speak>
       <amazon:auto-breaths>Amazon Polly is a service that turns text into lifelike speech, 
       allowing you to create applications that talk and build entirely new categories of speech-
       enabled products. Amazon Polly is a text-to-speech service that uses advanced deep learning 
       technologies to synthesize speech that sounds like a human voice. With dozens of lifelike 
       voices across a variety of languages, you can select the ideal voice and build speech-
       enabled applications that work in many different countries.</amazon:auto-breaths>
  </speak>
  ```
+  Menggunakan mode otomatis dengan kontrol volume. Parameter yang tidak ditentukan (`duration`dan`frequency`) diatur ke nilai default (`medium`). 

  ```
  <speak>
       <amazon:auto-breaths volume="x-soft">Amazon Polly is a service that turns text into lifelike 
       speech, allowing you to create applications that talk and build entirely new categories of 
       speech-enabled products. Amazon Polly is a text-to-speech service, that uses advanced deep 
       learning technologies to synthesize speech that sounds like a human voice. With dozens of 
       lifelike voices across a variety of languages, you can select the ideal voice and build speech-
       enabled applications that work in many different countries.</amazon:auto-breaths>
  </speak>
  ```
+  Menggunakan mode otomatis dengan kontrol frekuensi. Parameter yang tidak ditentukan (`duration`dan`volume`) diatur ke nilai default (`medium`).

  ```
  <speak>
       <amazon:auto-breaths frequency="x-low">Amazon Polly is a service that turns text into lifelike 
       speech, allowing you to create applications that talk and build entirely new categories of 
       speech-enabled products. Amazon Polly is a text-to-speech service, that uses advanced deep 
       learning technologies to synthesize speech that sounds like a human voice. With dozens of 
       lifelike voices across a variety of languages, you can select the ideal voice and build speech-
       enabled applications that work in many different countries.</amazon:auto-breaths>
  </speak>
  ```
+  Menggunakan mode otomatis dengan beberapa parameter. Untuk `Duration` parameter yang tidak ditentukan, Amazon Polly menggunakan nilai `medium` default ().

  ```
  <speak>
       <amazon:auto-breaths volume="x-loud" frequency="x-low">Amazon Polly is a service that turns 
       text into lifelike speech, allowing you to create applications that talk and build entirely new 
       categories of speech-enabled products. Amazon Polly is a text-to-speech service, that uses 
       advanced deep learning technologies to synthesize speech that sounds like a human voice. With 
       dozens of lifelike voices across a variety of languages, you can select the ideal voice and build 
       speech-enabled applications that work in many different countries.</amazon:auto-breaths>
  </speak>
  ```



# Gaya berbicara penyiar berita
<a name="newscaster-tag"></a>

**<amazon:domain name="news">

Gaya penyiar berita hanya tersedia untuk suara Matthew atau Joanna, yang hanya tersedia dalam bahasa Inggris Amerika (en-US), Lupe, dalam bahasa Spanyol AS (es-AS) dan Amy, dalam bahasa Inggris Inggris (en-GB). Ini hanya didukung saat menggunakan `Neural` format. 

Untuk menggunakan gaya penyiar berita, Anda menggunakan tag SSML dan sintaks berikut: 

```
<amazon:domain name="news">text</amazon:domain>
```

Misalnya, Anda dapat menggunakan gaya penyiar berita dengan suara Amy sebagai berikut: 

```
<speak> 
<amazon:domain name="news"> 
From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: 

The maiden voyage of the White Star liner Titanic, the largest ship ever launched, has ended in disaster. 

The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck 
an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, 
and several liners were near enough to catch and respond to the call.
</amazon:domain> 
</speak>
```

# Menambahkan kompresi rentang dinamis
<a name="drc-tag"></a>

**<amazon:effect name="drc">

Tag ini didukung oleh format TTS bentuk panjang, saraf, dan standar.

Tergantung pada teks, bahasa, dan suara yang digunakan dalam file audio, suara berkisar dari lembut hingga keras. Suara lingkungan, seperti suara kendaraan yang bergerak, seringkali dapat menutupi suara yang lebih lembut, yang membuat trek audio sulit didengar dengan jelas. Untuk meningkatkan volume suara tertentu dalam file audio Anda, gunakan tag kompresi rentang dinamis (`drc`).

`drc`Tag menetapkan ambang batas “kenyaringan” midrange untuk audio Anda, dan meningkatkan volume (penguatan) suara di sekitar ambang batas itu. Ini menerapkan kenaikan keuntungan terbesar yang paling dekat dengan ambang batas, dan kenaikan kenaikan berkurang lebih jauh dari ambang batas. 

![\[Kompresi rentang dinamis meningkatkan volume suara di sekitar ambang batas tertentu.\]](http://docs.aws.amazon.com/id_id/polly/latest/dg/images/drc-on.png)


Ini membuat suara kelas menengah lebih mudah didengar di lingkungan yang bising, yang membuat seluruh file audio lebih jelas.

`drc`Tag adalah parameter Boolean (baik ada atau tidak). Ini menggunakan sintaks: `<amazon:effect name="drc">` dan ditutup dengan`</amazon:effect>`.

Anda dapat menggunakan `drc` tag dengan suara atau bahasa apa pun yang didukung oleh Amazon Polly. Anda dapat menerapkannya ke seluruh bagian rekaman, atau hanya untuk beberapa kata. Contoh:

```
<speak>
     Some audio is difficult to hear in a moving vehicle, but <amazon:effect name="drc"> this audio 
     is less difficult to hear in a moving vehicle.</amazon:effect>
</speak>
```

**catatan**  
Ketika Anda menggunakan "`drc`" dalam `amazon:effect ` sintaks, itu peka huruf besar/kecil. 

**Menggunakan `drc` dengan `prosody volume` Tag**  
Seperti yang ditunjukkan grafik berikut, `prosody volume` tag secara merata meningkatkan volume seluruh file audio dari level asli (garis putus-putus) ke tingkat yang disesuaikan (garis padat). Untuk lebih meningkatkan volume bagian tertentu dari file, gunakan `drc` tag dengan `prosody volume` tag. Menggabungkan tag tidak memengaruhi pengaturan `prosody volume` tag. 

![\[Menggunakan prosody volume tag meningkatkan volume di seluruh file audio.\]](http://docs.aws.amazon.com/id_id/polly/latest/dg/images/prosodyloud.png)


Saat Anda menggunakan `prosody volume` tag `drc` dan bersama-sama, Amazon Polly menerapkan `drc` tag terlebih dahulu, meningkatkan suara kisaran menengah (yang mendekati ambang batas). Ini kemudian menerapkan `prosody volume` tag dan selanjutnya meningkatkan volume seluruh trek audio secara merata.

![\[Menggunakan drc tag dengan prosody volume tag meningkatkan volume suara kelas menengah di samping volume seluruh trek audio.\]](http://docs.aws.amazon.com/id_id/polly/latest/dg/images/prosody+drc.png)


Untuk menggunakan tag bersama-sama, sarang satu di dalam yang lain. Contoh:

```
<speak>
     <prosody volume="loud">This text needs to be understandable and loud. <amazon:effect name="drc">
     This text also needs to be more understandable in a moving car.</amazon:effect></prosody> 
</speak>
```

Dalam teks ini, `prosody volume` tag meningkatkan volume seluruh bagian menjadi “keras.” `drc`Tag meningkatkan volume nilai kisaran menengah di kalimat kedua.

**catatan**  
Saat menggunakan `prosody volume` tag `drc` dan bersama-sama, gunakan praktik XHTML standar untuk tag bersarang.



# Berbicara dengan lembut
<a name="phonation-tag"></a>

**<amazon:effect phonation="soft">

Tag ini saat ini hanya didukung oleh format TTS standar.

Untuk menentukan bahwa teks input harus diucapkan dengan softer-than-normal suara, gunakan <amazon:effect phonation="soft">tag.

Ini menggunakan sintaks:

```
<amazon:effect phonation="soft">text</amazon:effect>
```

Misalnya, Anda dapat menggunakan tag ini dengan suara Matius sebagai berikut:

```
<speak>
     This is Matthew speaking in my normal voice. <amazon:effect phonation="soft">This 
     is Matthew speaking in my softer voice.</amazon:effect>
</speak>
```





# Mengontrol timbre
<a name="vocaltractlength-tag"></a>

*<amazon:efek> vocal-tract-length*

Tag ini saat ini hanya didukung oleh format TTS standar.

Timbre adalah kualitas nada suara yang membantu Anda membedakan antara suara, bahkan ketika mereka memiliki nada dan kenyaringan yang sama. Salah satu fitur fisiologis terpenting yang berkontribusi pada timbre bicara adalah panjang saluran vokal. Saluran vokal adalah rongga udara yang membentang dari atas pita suara hingga ke tepi bibir. 

Untuk mengontrol timbre ucapan keluaran di Amazon Polly, gunakan `vocal-tract-length` tag. Tag ini memiliki efek mengubah panjang saluran vokal pembicara, yang terdengar seperti perubahan ukuran speaker. Ketika Anda meningkatkan`vocal-tract-length`, speaker terdengar lebih besar secara fisik. Saat Anda menguranginya, speaker terdengar lebih kecil. Anda dapat menggunakan tag ini dengan salah satu suara dalam portofolio Amazon Text-to-Speech Polly. 

Untuk mengubah timbre, gunakan nilai berikut: 
+ `+n%`atau`-n%`: Menyesuaikan panjang saluran vokal dengan persentase perubahan relatif pada suara saat ini. Misalnya, \$14% atau -2%. Nilai yang valid berkisar dari \$1100% hingga -50%. Nilai di luar rentang ini terpotong. Misalnya, \$1111% terdengar seperti \$1100% dan -60% terdengar seperti -50%.
+ `n%`: Mengubah panjang saluran vokal menjadi persentase absolut dari panjang saluran suara saat ini. Misalnya, 110% atau 75%. Nilai absolut 110% setara dengan nilai relatif \$110%. Nilai absolut 100% sama dengan nilai default untuk suara saat ini.

Contoh berikut menunjukkan cara mengubah panjang saluran vokal untuk mengubah timbre:

```
<speak>
     This is my original voice, without any modifications. <amazon:effect vocal-tract-length="+15%"> 
     Now, imagine that I am much bigger. </amazon:effect> <amazon:effect vocal-tract-length="-15%"> 
     Or, perhaps you prefer my voice when I'm very small. </amazon:effect> You can also control the 
     timbre of my voice by making minor adjustments. <amazon:effect vocal-tract-length="+10%"> 
     For example, by making me sound just a little bigger. </amazon:effect><amazon:effect 
     vocal-tract-length="-10%"> Or, making me sound only somewhat smaller. </amazon:effect> 
</speak>
```

**Menggabungkan Beberapa Tag**

Anda dapat menggabungkan `vocal-tract-length` tag dengan tag SSML lain yang didukung oleh Amazon Polly. Karena timbre (panjang saluran vokal) dan nada terhubung erat, Anda mungkin mendapatkan hasil terbaik dengan menggunakan tag `vocal-tract-length` dan tag. `<prosody pitch>` Untuk menghasilkan suara yang paling realistis, kami sarankan Anda menggunakan persentase perubahan yang berbeda untuk kedua tag. Bereksperimenlah dengan berbagai kombinasi untuk mendapatkan hasil yang Anda inginkan. 

Contoh berikut menunjukkan bagaimana menggabungkan tag.

```
<speak> 
     The pitch and timbre of a person's voice are connected in human speech.
     <amazon:effect vocal-tract-length="-15%"> If you are going to reduce the vocal tract length, 
     </amazon:effect><amazon:effect vocal-tract-length="-15%"> <prosody pitch="+20%"> you 
     might consider increasing the pitch, too. </prosody></amazon:effect>  
     <amazon:effect vocal-tract-length="+15%"> If you choose to lengthen the vocal tract, 
     </amazon:effect> <amazon:effect vocal-tract-length="+15%"> <prosody pitch="-10%"> 
     you might also want to lower the pitch. </prosody></amazon:effect>
</speak>
```



# Berbisik
<a name="whispered-tag"></a>

**<amazon:effect name="whispered">

Tag ini saat ini hanya didukung oleh format TTS standar.

Tag ini menunjukkan bahwa teks input harus diucapkan dengan suara berbisik daripada sebagai ucapan normal. Ini dapat digunakan dengan salah satu suara dalam portofolio Amazon Text-to-Speech Polly.

Ini menggunakan sintaks berikut:

```
<amazon:effect name="whispered">text</amazon:effect>
```

Contoh:

```
<speak>
     <amazon:effect name="whispered">If you make any noise, </amazon:effect> 
     she said, <amazon:effect name="whispered">they will hear us.</amazon:effect>
</speak>
```

Dalam hal ini, pidato yang disintesis yang diucapkan oleh karakter dibisikkan, tetapi frasa “katanya” diucapkan dalam pidato sintesis normal dari suara Amazon Polly yang dipilih.

Anda dapat meningkatkan efek “berbisik” dengan memperlambat tingkat prosodi hingga 10%, tergantung pada efek yang Anda inginkan. 

Contoh:

```
<speak>
     When any voice is made to whisper, <amazon:effect name="whispered">
     <prosody rate="-10%">the sound is slower and quieter than normal speech
     </prosody></amazon:effect>
</speak>
```

Saat membuat tanda ucapan untuk suara berbisik, aliran audio juga harus menyertakan suara yang dibisikkan untuk memastikan bahwa tanda ucapan cocok dengan aliran audio.

