View a markdown version of this page

使用音频填充器提高机器人的响应能力 - Amazon Lex

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用音频填充器提高机器人的响应能力

在用户说话结束和机器人开始响应之间的暂停期间,Audio filler 会播放简短的背景音频,例如轻快的旋律或轻柔的按键。这可以掩盖处理延迟,让语音对话感觉自然。

注意

启动时,音频填充器可用于支持语音转语音交互并已配置的机器人区域设置。unifiedSpeechSettings对其他对话模式的支持将在未来几个月内推出。

可用的音频填充器类型

Amazon Lex V2 提供七种内置填充声音,分为两个系列:

  • Melody-Chipper Chime

  • Melody-好奇的爬行

  • Melody-瑞波币上升

  • Melody-Pantient

  • Melody-Pondering

  • 打字-动感按键

  • 打字-Quiet qwerty

在将每个选项保存到机器人区域之前,使用 Amazon Lex V2 控制台中的 “播放音频预览” 按钮收听每个选项。

定时参数

您可以调整三个定时参数来控制音频填充器何时播放以及如何过渡到机器人响应:

startDelayInMilliseconds

是时候在用户说完话后再开始音频填充播放了。有效范围5005000毫秒。默认值为 1000

minimumPlayDurationInMilliseconds

音频填充器启动后的最短播放时间,即使机器人响应更快地准备就绪。有效范围10005000毫秒。默认值为 3000

responseDeliveryDelayInMilliseconds

在音频填充播放结束和机器人开始响应之间插入静默延迟。有效范围2001000毫秒。默认值为 500

配置音频填充器

在创建或更新机器人语言环境时,您可以通过 Amazon Lex V2 控制台、Amazon Connect 对话人工智能设计器或 AWS CLI 和软件开发工具包配置音频填充器。

Using the console
  1. 打开 Amazon Lex V2 主机,网址为https://console.aws.amazon.com/lexv2/

  2. 从列表中选择您的机器人。

  3. 在左侧导航窗格中,选择机器人语言

  4. 选择要配置的语言,或者选择 “添加语言” 来添加新语言。

  5. 在 “音频填充器” 部分,选择 “启用音频填充器”。

  6. 从旋律或键入选项中选择一种音频类型。使用 “播放音频预览” 收听选定的填充物。

  7. 根据需要调整 “开始延迟”、“最短播放时长” 和 “响应缓冲区” 的计时滑块。

  8. 选择 “保存” 以应用更改。

Using the Amazon Connect Conversational AI designer
  1. 打开 Amazon Connect 管理网站,然后导航到您的机器人的对话式 AI 设计器。

  2. 打开要配置的语言(区域设置)。

  3. 在 “音频填充器” 部分,启用音频填充器并选择一种音频类型。

  4. 调整开始延迟最小播放持续时间响应缓冲区值。

  5. 保存更改。设计人员将同样audioFillerSettings的方法应用于底层的 Amazon Lex V2 机器人区域设置。

Using the API

您可以在以下 API 操作中使用audioFillerSettings参数设置音频填充器:

  • CreateBotLocale-为新的机器人区域配置音频填充器。

  • UpdateBotLocale-修改现有机器人区域的音频填充器。

  • DescribeBotLocale-查看当前的音频填充器配置。

例使用 AWS CLI 配置音频填充器
aws lexv2-models update-bot-locale \ --bot-id "bot-1234567890abcdef0" \ --bot-version "DRAFT" \ --locale-id "en_US" \ --nlu-intent-confidence-threshold 0.40 \ --audio-filler-settings '{ "enabled": true, "audioType": "MELODY_CHIPPER_CHIME", "startDelayInMilliseconds": 1000, "minimumPlayDurationInMilliseconds": 3000, "responseDeliveryDelayInMilliseconds": 500 }'

带有 AI 代理临时消息的音频填充器

音频填充器与 AI 代理临时消息配合使用。当 AI 代理向呼叫者发送临时消息(例如,“让我帮你查一下”)时,启动延迟计时器是从该临时消息的结尾开始测量的,而不是从最初的调用开始计算的。这样可以防止音频填充器与代理的语音重叠,并确保呼叫者所经历的延迟是根据他们听到的最新音频来衡量的。

带有对话框和发货代码挂钩的音频填充器

在 Lambda 对话框代码挂钩和配送代码挂钩引入的处理间隙期间,还会播放音频填充器。同样的计时参数适用,因此无论您的机器人是在同一回合将处理委托给 AI 代理、代码挂钩还是两者兼而有之,呼叫者都能听到一致的体验。

音频填充器的最佳实践

  • 将填充物与您的品牌声音相匹配。为消费者或零售体验使用旋律填充器,并在用户期望机器人积极执行任务时键入填充物。

  • 根据您的延迟配置文件调整开始延迟。如果大多数机器人的响应速度都快于startDelayInMilliseconds,则填充器很少会播放。降低延迟密集型工作负载的延迟,为快速响应的机器人提高延迟。

  • 对于快速机器人,尽量缩短最短的游戏时间。长时间使用快速机器人会在响应准备minimumPlayDurationInMilliseconds就绪后按住填充物来增加感知到的延迟。

  • 使用代表性流量进行测试。在投入生产之前,在现实对话中验证填充物的选择和时机。