View a markdown version of this page

使用雙向串流合成語音 - Amazon Polly

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用雙向串流合成語音

Amazon Polly 提供的StartSpeechSynthesisStream操作會建立 HTTP/2 連線,並在您的應用程式和服務之間進行雙向通訊。合成音訊轉返時,文字會從應用程式流向 Amazon Polly。您可以在可用時傳送文字,Amazon Polly 會在合成時傳回音訊,而不會等待另一個邊完成。

當文字逐漸產生而非一次全部時,這很有用。例如,由 Amazon Bedrock 上基礎模型提供支援的客戶服務聊天機器人會透過權杖產生其回應權杖。透過雙向串流,您的應用程式可以在模型產生每個文字區塊時轉送至 Amazon Polly,並在模型仍在產生其餘回應時開始播放音訊回來電者。

此操作需要生成引擎和支援 HTTP/2 事件串流的 AWS SDK。音訊會以一系列區塊的形式到達,您的應用程式會累積到完整的音訊輸出。此操作不支援語音標記。

注意

不支援 AWS CLI (v1 和 v2)、 AWS Tools for PowerShell (v4 和 v5)、Python 和 .NET v3。您可以使用雙向串流 API 搭配下列 SDKs: AWS SDK for Java 2.x、JavaScript v3、.NET v4、C++、Go v2、Kotlin、PHP v3、Ruy v3、Rust 和 Swift。