我喜欢Google Speech to Text API,它具有出色的准确性,以我的经验,它比Azure API好很多。原因是,我能够将请求中的期望单词列表发送到Google API,因此,增加了出现这些术语/短语的可能性。使用Azure,我只能制作语音模型。问题是,我将不得不为每个请求创建一个新模型,因为每个请求将具有与其余请求不同的词汇表等。这些请求不是特定于行业的,而是完全随机的。
所以,我的问题是,我可以将带有请求的期望单词列表发送到Azure API吗?
欢呼声
您解决了问题吗?
关于Azure,您需要首先收集与您的问题和行业相关的培训数据。然后,您可以在此数据集上训练一个模型,在生产中,可以使用该模型来转录音频。
[每次收到新请求时,您不会训练一个模型。