对于一个项目,我想让人们在Kinect(v1)面前说话,他们说的每个形容都应该出现在屏幕上。 不幸的是,我是Kinect开发的新手,我在找到好的文档和教程时遇到了麻烦。
我对这个想法做了一些测试,但我能做的最好的就是破解Kinect SDK样本中的一个基本语音识别,并在语法中加入一些形容词。 问题是,当在Kinect前面说完整句子时,这不能很好地工作,你必须大声说话并且接近Kinect。我将无法将靠近扬声器的Kinect放置。
我也尝试过使用System.Speech
和(像样本)Microsoft.Speech
。然而,他们似乎都没有支持Dictation
语法。我做了一些关于错误(Grammar referenced by grammar not found
)意味着什么的研究,似乎这表明我的系统上没有安装口述功能,或类似的东西。我不知道怎么从这里开始。
你能指点一些我可以尝试去识别人们在Kinect(或其他麦克风)面前说的形容词吗?
我最终使用了基于语法的语音识别,我只是预先填写了许多形容词。用户一次只能说一个字,而不是能够畅所欲言,但我无法使其工作。