

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 語音標記輸出
<a name="output"></a>

Amazon Polly 會在以行分隔的 JSON 串流中傳回語音標記物件。語音標記物件包含下列欄位：
+  **時間** – 從對應的音訊串流開始的時間戳記 (以毫秒為單位)
+  **type** – 語音標記的類型 （句子、字詞、視素或 ssml)
+  **start** – 輸入文字中物件開頭的位元組 （而非字元） 偏移量 （不包括視覺標記）
+  **end** – 物件結尾在輸入文字 （不包括視覺標記） 中的位元組 （而非字元） 偏移 
+  **值** – 這會根據語音標記的類型而異
  +  **SSML**：<mark> SSML 標籤
  +  **視素**：視素名稱
  +  **文字**或**句子**：輸入文字的子字串，由開始和結束欄位分隔

例如，Amazon Polly 會從文字「Mary has a little lamb」產生下列`word`語音標記物件：

```
{"time":373,"type":"word","start":5,"end":8,"value":"had"}
```

所述文字 (「had」) 在音訊串流開始後 373 毫秒起始，並在輸入文字的位元組 5 開始位元組 8 結束。

**注意**  
此中繼資料是用於 `Joanna`voice-id。如果您使用另一個具相同輸入文字的語音，中繼資料可能不同。