语音输入游戏的Google助手

我想在Google助手上开发一个游戏/技能，一旦用户输入了游戏/会话，它需要满足以下条件（“嘿，谷歌，开始游戏123”）

播放几分钟的音频文件
在第一个剪辑仍在播放时播放第二个音频文件
一直在听。在播放文件时，游戏需要侦听并响应特定的语音短语，而无需使用“ Hey Google”关键字。

是否支持这些功能？预先感谢。

0
投票

我在这些方面没有太多经验，但是我建议为此工作使用一些API。尝试搜索它们，有很多教程。

0
投票

“也许。”这很大程度上取决于您要在Google平台上的Actions上支持哪些设备以及某些要求的必要性。根据您的需要，您也许可以玩一些把戏。

播放“几分钟”长的音频文件。

您可以播放长达120秒的audio using SSML。但这将在打开麦克风以接受响应之前播放。

对于更长的文件，您可以使用Media Response。它具有一个有趣的功能，即当音频结束时，一个事件将被发送到您的服务器，因此您只能采用某种有限的方式来处理定时响应和循环。不利的一面-用户必须说“嘿Google”才能打断它。（目前使用它时存在一些错误。）

由于您正在玩游戏，因此可以利用Interactive Canvas。这样您就可以使用HTML <audio>标记和Web Audio API之类的东西。最大的缺点是，此功能仅在智能显示器和Android设备上可用-您不能在智能扬声器上使用它。

播放多个音轨

Google对SSML进行了扩展，允许parallel audio tracks进行多种语音和音频输出。但是您不能将它们放在媒体响应之上。

如果您将Web Audio API与Interactive Canvas一起使用，我相信它支持多个同时输入。

我可以让麦克风保持打开状态，这样他们不必每次都说“ Hey Google”。

可能不是，但这在某些情况下可能不是一个好主意。

对于智能扬声器，您不能这样做。人们已经习惯了对话式的交流，所以他们在等待沉默，以知道何时该说些什么。如果您不断提供音频，他们不一定知道何时该轮到他们了。

使用Interactive Canvas设备，我们可以在显示器上进行提示。而且我们可以在这段时间内保持麦克风处于打开状态……至少到一定程度。不利的一面是，我们不知道麦克风何时打开和关闭，因此在这段时间内我们无法回避音频。（至少还没有。）

我能做我想做的吗？

您是唯一的法官。听起来交互式画布可能可以很好地满足您的需求-但不会在所有地方都有效。在某些情况下，您可能可以determine the capabilities of the device the user is playing with并根据所具有的功能介绍稍有不同的游戏。例如，谷歌通过其“ Lucky Trivia”游戏来做到这一点。

问题描述投票：0回答：2

2个回答

最新问题

语音输入游戏的Google助手

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2