我想将音频文件转录为文本。我不需要Google机器学习Api来保证准确性。
我只需要检测汽车,摩托车,叉子,汤匙等少量单词。字是固定的。
我知道机器学习需要训练模型,但是我要检测的单词是固定的。
我需要机器学习来做到这一点吗?
如何在python中实现它?
看看这个python模块:
https://pypi.org/project/SpeechRecognition/
将音频转录为文本不是问题使用AI /机器学习解决自己,它由多个库覆盖。
[许多人编写了可以作为示例的脚本语音识别应用程序。两篇有用的文章: