C# - Watson - 语音到API API

问题描述 投票:0回答:1

我正在尝试在C#windows应用程序中创建一个Windows应用程序,它应该使用IBM Watson服务来执行Speech to Text转换。

我们如何实现IBM Watson Speech to Text API服务https://stream.watsonplatform.net/speech-to-text/api,它应该监听用户语音并写入输出文本。

我搜索了很多文章,在所有这些例子中,.wav(音频)文件作为输入传递,输出文本被写入。

我试图更实时地执行此语音到文本,而不是传递现有或存储的音频(.wav)文件。

使用Microsoft.Speech可以使用Recognizer.SetInputToDefaultAudioDevice()等代码完成相同的功能。这里的缺点是,我们必须提供DictationGrammer。这样应用程序就可以识别语音并转换为文本。

是否可以通过Watson API服务执行类似的任务?

c# api speech-recognition speech-to-text watson
1个回答
2
投票

IBM Watson SDK for .NET支持WebSockets,它可以满足您转录更多实时与上传音频文件的要求:

WebSockets包含一个调用,通过WebSocket协议与服务建立持久连接。

SDK可以找到here,SDK中的Speech to Text的具体细节可以在here找到。

© www.soinside.com 2019 - 2024. All rights reserved.