我可以使用Sphinx4附带的en-us东西,没问题:
cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us")
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict")
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin")
我可以用它来录制英文声音文件录制。
现在我想用德语录音。在网站上我找到了Acoustic and Language Models的链接。其中有一个档案'德国Voxforge'。我找到声学模型路径的相应文件。但就我所见,它不包含字典或语言模型。
如何在Sphinx4中获取德语的字典和语言模型路径?
你自己创建它们。您可以从字幕或维基百科转储创建语言模型。文档是here。
最新的德国型号实际上不在CMUSphinx页面上,它们位于github/gooofy。在这个gooofy项目中,您可以找到字典文档,模型和相关的matherials。
我已经尝试过使用pocketsphinx的德语模型,并且由于“无效”语言模型* .lm.bin而出现了一些错误,所以我使用的是* lm.gz,它现在可以使用了。
正确的清单是:
要获得嗯路径,你应该解压缩:cmusphinx-de-voxforge-5.2.tar.gz
我认为Sphinx4应该是一样的,所以可以尝试一下。