语音输入游戏的Google助手

问题描述 投票:0回答:2

我想在Google助手上开发一个游戏/技能,一旦用户输入了游戏/会话,它需要满足以下条件(“嘿,谷歌,开始游戏123”)

  • 播放几分钟的音频文件

  • 在第一个剪辑仍在播放时播放第二个音频文件

  • 一直在听。在播放文件时,游戏需要侦听并响应特定的语音短语,而无需使用“ Hey Google”关键字。

是否支持这些功能?预先感谢。

actions-on-google
2个回答
0
投票

我在这些方面没有太多经验,但是我建议为此工作使用一些API。尝试搜索它们,有很多教程。


0
投票

“也许。”这很大程度上取决于您要在Google平台上的Actions上支持哪些设备以及某些要求的必要性。根据您的需要,您也许可以玩一些把戏。

播放“几分钟”长的音频文件。

您可以播放长达120秒的audio using SSML。但这将在打开麦克风以接受响应之前播放。

对于更长的文件,您可以使用Media Response。它具有一个有趣的功能,即当音频结束时,一个事件将被发送到您的服务器,因此您只能采用某种有限的方式来处理定时响应和循环。不利的一面-用户必须说“嘿Google”才能打断它。 (目前使用它时存在一些错误。)

由于您正在玩游戏,因此可以利用Interactive Canvas。这样您就可以使用HTML <audio>标记和Web Audio API之类的东西。最大的缺点是,此功能仅在智能显示器和Android设备上可用-您不能在智能扬声器上使用它。

播放多个音轨

Google对SSML进行了扩展,允许parallel audio tracks进行多种语音和音频输出。但是您不能将它们放在媒体响应之上。

如果您将Web Audio API与Interactive Canvas一起使用,我相信它支持多个同时输入。

我可以让麦克风保持打开状态,这样他们不必每次都说“ Hey Google”。

可能不是,但这在某些情况下可能不是一个好主意。

对于智能扬声器,您不能这样做。人们已经习惯了对话式的交流,所以他们在等待沉默,以知道何时该说些什么。如果您不断提供音频,他们不一定知道何时该轮到他们了。

使用Interactive Canvas设备,我们可以在显示器上进行提示。而且我们可以在这段时间内保持麦克风处于打开状态……至少到一定程度。不利的一面是,我们不知道麦克风何时打开和关闭,因此在这段时间内我们无法回避音频。 (至少还没有。)

我能做我想做的吗?

您是唯一的法官。听起来交互式画布可能可以很好地满足您的需求-但不会在所有地方都有效。在某些情况下,您可能可以determine the capabilities of the device the user is playing with并根据所具有的功能介绍稍有不同的游戏。例如,谷歌通过其“ Lucky Trivia”游戏来做到这一点。

© www.soinside.com 2019 - 2024. All rights reserved.