Pocketsphinx建立小词汇模型

问题描述投票：0回答：1

我想为Pocketsphinx（.lm）用德语构建一个小的词汇模型，该模型只能识别0-9之间的德语数字。使用Voxforge de-de模型时，性能非常差（几乎无法识别）。我用类似的英语方法尝试了TIDIGTS-使用仅包含数字的专用模型。这一工作正常。因此，显然，我需要构建一个仅包含我的数字的.lm模型-为此，我已经记录了很多wav文件并将其转录为所需的XML格式。但是，当我查看https://cmusphinx.github.io/wiki/tutoriallm/的操作方法时，只会得到关于如何建立具有大量词汇表的语言模型或如何使用SRILM进行构建的提示-由于限制性许可，这对我来说完全没有用。那么如何从我的wav数据构建LM？

model

cmusphinx

pocketsphinx

1个回答

0
投票

[好吧，这就是我所做的：我使用了通用的德国模型（来自voxforge.com的模型），使用sphinx_lm_convert将.lm.bin转换为.lm文件，然后编辑了除所需数字以外的所有内容。然后，我使用录制的音频资料通过sphinxtrain（使用sphinx_fe，bw，map-adapt）调整模型。现在，它是相对可靠的（大约80％的识别率）。我还通过用拒绝词（在我的情况下为FALSE）修改语法和字典来实现误报否定，这也达到了70％。

Pocketsphinx建立小词汇模型

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1