我正在尝试在C#windows应用程序中创建一个Windows应用程序,它应该使用IBM Watson服务来执行Speech to Text转换。
我们如何实现IBM Watson Speech to Text API服务https://stream.watsonplatform.net/speech-to-text/api,它应该监听用户语音并写入输出文本。
我搜索了很多文章,在所有这些例子中,.wav(音频)文件作为输入传递,输出文本被写入。
我试图更实时地执行此语音到文本,而不是传递现有或存储的音频(.wav)文件。
使用Microsoft.Speech可以使用Recognizer.SetInputToDefaultAudioDevice()等代码完成相同的功能。这里的缺点是,我们必须提供DictationGrammer。这样应用程序就可以识别语音并转换为文本。
是否可以通过Watson API服务执行类似的任务?