将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。
在Kaldi上运行TIMIT示例时出现BrokenPipeError
我正在尝试安装并运行Kaldi TIMIT示例。 kaldi / egs / timit / s5目录中的./run.sh:我收到错误:fstcompile:加载共享库时出错:libfstscript.so.10:...
我想用IBM Watson开始语音识别。下一步我将在Pepper人形机器人上运行我的代码。其实我不能导入下面的行:import com.ibm.watson.developer_cloud ....
我试着发一个关于wit.ai的演讲但我不明白如果我发送的音频文件大于10秒,如果我发送每个小于10秒的分块数据。
我一直在使用python 3.7.3中的语音识别。作为一个基础,我使用了Wit.ai的示例代码,我已经在线了。我的问题是,我无法增加重新编码时间。通过......
Xamarin表示android语音识别ActivityNotFoundException
我一直在尝试将语音到文本添加到我的Android应用程序,但我一直得到“Android.Content.ActivityNotFoundAcception”。我正在使用android 5.0(棒棒糖)模拟器,因为我的电脑无法启动任何...
Google Speech To Text API:从mp4中提取音频
我正在尝试使用Python从AWS S3中保 存的视频(mp4)文件中提取文本。我能够使用音频文件,但不能使用MP4。可以直接使用MP4,还是应该......
使用gcloud speech api在飞镖中进行实时语音识别
我想在一个用dart编写的扑动项目中使用谷歌的实时语音识别API。我已经激活了一个gcloud帐户,创建了api密钥(这应该是唯一必要的身份验证...
如何在服务器端实现语音识别(请不要建议HTML5的x-webkit-speech,javascript等)?该程序将采用音频文件作为输入,并提供足够的精度...
我需要一个专门的解决方案,以检测智能手机上使用的1到1000之间的数字。最佳解决方案是让此SDK脱机工作。任何的想法 ?我找不到......
如何使用密钥文件验证SpeechClient V1(PHP / Laravel)
我正在尝试使用'keyFilePath'和'projectId'参数验证SpeechClient,如下所示:$ speech = new SpeechClient(['projectId'=>'actualProjectId,'...
如何修复服务被cors策略阻止的时间:请求的资源上没有'access-control-allow-origin'标头
我正在尝试在我的NodeJs应用程序中访问IBM Watson提供的文本到语音服务,但我看到访问拒绝错误,因为该服务已被CORS策略阻止。通过...尝试所有方式
在android中以编程方式禁用软输入键盘上的语音到文本按钮(微电话)
在此先感谢您的帮助。我正在开发一个用于研究目的的Android应用程序,需要禁用软输入键盘上的语音到文本按钮。原因是......
我希望创建一个具有语音到文本的应用程序。我知道使用RecognizerIntent的这种能力:http://android-developers.blogspot.com/search/label/Speech%20Input但是 - 我......
我正在尝试为我的Android应用程序使用Google Cloud Platform的语音到文本API。我已经传递了一个录制的音频文件,用于转换为文本。我无法解决一个被描述为“...的IOException”
SyntaxError:位置参数跟随关键字参数|用于语音到文本的Python客户端
我正在尝试使用谷歌云API将音频转换为文本。我正在关注他们的官方文件,但它让我发出错误文件“heyfinal.py”,第15行,请求,^ ...
与python SpeechRecognition库一起设置Snowboy热门词检测
我想在python项目中同时使用Snowboy热门词检测库和SpeechRecognition库。然而,我遇到了许多错误,试图让两个人玩......
我实际上使用Pocketsphinx语音到文本音频文件。我使用这个命令:pocketsphinx_continuous -logfn / dev / null -infile audio.wav> text.txt,我想知道是否有办法获得......
通过遵循IBM Tutorial中的示例代码访问IBM语音到文本服务时收到错误“未授权”
我正在遵循IBM语音到文本入门教程中的示例代码,以转录从同一教程下载的“flac”音频文件。但是我收到此错误{“code”:401,“error”:“...
我正在使用谷歌API语音到文本。下面是我的python代码:从google.cloud导入speech_v1p1beta1作为语音导入os os.environ [“GOOGLE_APPLICATION_CREDENTIALS”] =“C:\\ Users \\ chetan ....
我需要比较两个输出字符串,即原始转录和语音到文本服务的转录。数字通常以数字格式或单词形式写成,例如“四”或“四”。 ...