我有一个单词或句子,是否有任何方式/开源包来找到用户说出该单词的概率

问题描述 投票:0回答:1

我有一个单词/句子,是否有任何方式/开源包来找到用户说出该单词/句子的概率

speech-recognition speech-to-text speech kaldi
1个回答
2
投票

最常用的免费语音识别工具包是:

  1. Kaldi
  2. CMU Sphinx

使用Python,使用pocketsphinx-python设置基本语音识别系统非常简单。有点棘手,但根据我的经验,更好的结果是建立一个使用Kaldi的系统,例如使用kaldi-gstreamer-server

另一个选择是使用如下API:

  • Microsoft Bing speech
  • Google Cloud Speech
  • IBM演讲文本

这个SpeechRecognition python库是一个很好的切入点。但是,请记住,对于这些服务,您需要一个API密钥。

在你的情况下,你说你有一个给定的句子,并希望得到这句话的确切概率。这与一般语音识别任务略有不同,因为您有更多的先验信息可以使您的估计更准确。对于这个问题,常用的术语是关键字检测,您可以尝试将Keyword Lists与CMU Sphinx一起使用。

© www.soinside.com 2019 - 2024. All rights reserved.