Microsoft WebChat中的文本到语音输出音频的控制

问题描述 投票:0回答:1

我正在使用Microsoft WebChat连接到我的Bot服务,并且大多数交互主要基于语音。我正在使用Azure语音服务,并且语音输出完全由WebChat处理。我当前正在向Bot发送不活动的事件,如果在设置的持续时间后未收到输入,该事件会提示不活动的用户。这是根据传入的活动完成的。但是,在语音驱动的情况下,有时会在Bot仍在讲话消息时发送该事件,这是因为,即使该消息尚未完全发出声音,也会基于接收到传入活动的时间发送不活动事件。我想在每条消息发出声音后的第二秒发送不活动的提示,但是为此,我需要知道每条消息的播放持续时间。有没有一种方法可以获取文本语音转换服务提供的每条语音消息的输出持续时间,以便我可以在正确的时间发送不活动的提示?

botframework direct-line-botframework web-chat
1个回答
0
投票

目前,对于网络聊天,无法捕获语音持续时间。如果您希望看到它,我建议将其作为功能请求提交以供将来开发。您可以这样做here

通过其REST API(参见here),并且似乎通过SDK(参见here)实现认知服务的功能。您可以将语音STT / TTS直接集成到您的项目中,以便利用响应对象中可用的“ duration”属性。

希望获得帮助!

© www.soinside.com 2019 - 2024. All rights reserved.