本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用双向流媒体合成语音
Amazon Polly 提供的StartSpeechSynthesisStream操作通过您的应用程序和服务之间的双向通信建立 HTTP/2 连接。文本从您的应用程序流向 Amazon Polly,而合成音频则流回原处。您可以在文本可用时发送文本,Amazon Polly 会在合成时返回音频,而无需任何一方等待另一方完成。
当文本是逐步生成而不是一次全部生成时,这很有用。例如,由 Amazon Bedrock 基础模型提供支持的客户服务聊天机器人通过令牌生成其响应令牌。通过双向流式传输,您的应用程序可以在模型生成每个文本块时将其转发到 Amazon Polly,并在模型仍在生成其余响应时开始向调用者播放音频。
此操作需要生成引擎和支持 HTTP/2事件流的 AWS SDK。音频以一系列块的形式到达,您的应用程序会将其累积到完整的音频输出中。此操作不支持语音标记。
注意
不支持 AWS CLI (v1 和 v2)、 PowerShell (v4 和 v5) AWS 工具、Python 和.NET v3。你可以将双向直播 API 与以下 SDK 一起使用: AWS 适用于 Java 的 SDK 2.x、v JavaScript 3、.NET v4、C++、Go v2、Kotlin、PHP v3、Rust 和 Swift。