API或SDK只为数字(1到10000之间)进行语音识别?

问题描述 投票:2回答:1

我需要一个专门的解决方案,以检测智能手机上使用的1到1000之间的数字。最佳解决方案是让此SDK脱机工作。任何的想法 ?我发现Google言论或亚马逊转录的任何配置都不允许“仅限数量”

speech-recognition speech-to-text speech
1个回答
1
投票

严格要求人们提供数字是不对的,他们通常会说“我不知道”或“稍微等一下”,即使你问他们数字。你将大大损害这种体验。

您必须智能地分析识别结果,即使识别出非数字,您也必须采取相应的行动。

为了提高数字的准确性,您可以使用Google Speech API的word hint feature。只需添加数字和其他必需的单词作为提示,Google就会更准确地识别它们。亚马逊也有这个功能,他们称之为“custom vocabulary”。

如果你想使用离线API,你当然可以试试Kaldi。你可以用adapt Kaldi vocabulary数字来提高准确性,它会比Google API好得多。

© www.soinside.com 2019 - 2024. All rights reserved.