使用双向流媒体合成语音

Amazon Polly 提供的StartSpeechSynthesisStream操作通过您的应用程序和服务之间的双向通信建立 HTTP/2 连接。文本从您的应用程序流向 Amazon Polly，而合成音频则流回原处。您可以在文本可用时发送文本，Amazon Polly 会在合成时返回音频，而无需任何一方等待另一方完成。

当文本是逐步生成而不是一次全部生成时，这很有用。例如，由 Amazon Bedrock 基础模型提供支持的客户服务聊天机器人通过令牌生成其响应令牌。通过双向流式传输，您的应用程序可以在模型生成每个文本块时将其转发到 Amazon Polly，并在模型仍在生成其余响应时开始向调用者播放音频。

此操作需要生成引擎和支持 HTTP/2事件流的 AWS SDK。音频以一系列块的形式到达，您的应用程序会将其累积到完整的音频输出中。此操作不支持语音标记。

注意

不支持 AWS CLI （v1 和 v2）、 PowerShell （v4 和 v5） AWS 工具、Python 和.NET v3。你可以将双向直播 API 与以下 SDK 一起使用： AWS 适用于 Java 的 SDK 2.x、v JavaScript 3、.NET v4、C++、Go v2、Kotlin、PHP v3、Rust 和 Swift。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

语音合成示例

SynthesizeSpeech 并 StartSpeechSynthesisStream 进行了比较