将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。
我一直在最近的项目中尝试使用SpeechRecognition API(https://wicg.github.io/speech-api/#examples-recognition)。我当前正在使用浏览器Microsoft Edge,并根据...
是否有一种方法可以将实时记录的音频片段连续发送到Flutter.io中的后端服务器?
我正在创建一个使用Mozilla的Deep Speech API将用户的语音转录为文本的应用程序。输入内容需要某种格式的音频文件,为了使该应用正常工作,我...
我想知道那里有什么库可以将任何声音转换为本地文本(离线)。即使单词在python中是不可理解的或毫无意义的(直译单词)。
如何将语音转文本添加到在React Native上编写的聊天应用程序中
我和我的朋友们正在一个聊天应用程序项目中,它将实现Google的语音转文本,文本转语音和翻译API。有天赋的聊天和基于Firebase的聊天...
C ++'speechapi_cxx.h':没有这样的文件或目录,Visual Studio
[我正在尝试在Visual Studio 2019中对文本函数进行语音处理。我在Microsoft网站上找到此代码,但编译器显示'speechapi_cxx.h':没有此类文件或目录。 ...................................................
我正在制作需要输入音频的Android应用程序。并检测结巴。单词错误率可以检测到口吃吗? Java
我正在寻找具有文本到语音功能的API,更重要的是,具有语音到文本功能的API(我需要它来返回字符串)。最好是在C ++,C#,Java或Python上,但这并不重要,应该是...
Microsoft CognitiveServices语音类SpeechRecognizer,无法收集结果文本
我无法使用SpeechRecognizer类从wav文件中获取文本。当我调试下面的代码时,我看到当我延迟时会收到文本,但最终会崩溃。代码不正确吗?什么是...
cordova-plugin-speechrecognition在Adrioid上运作良好,但在iOS 13.3中失败
我创建了离子应用程序,并使用了cordova-plugin-speechrecognition进行语音到文本的转换。这在android mobile和ios模拟器上很好用,但在IOS 13.3上不起作用initSpeech(){...
服务泄漏了最初绑定在此处的ServiceConnection android.speech.SpeechRecognizer$Connection@2e1ecaf
我正在尝试运行一项服务,该服务一旦启动,便会使用语音识别器记录5秒钟的音频。但是,无论何时启动服务,它都会在语音识别器类中调用onError方法,...
Google Speech-to-Text:无效的识别'config':错误的采样率赫兹
我正在尝试使用REST全套服务将语音转换为文本。我正在使用.wav文件(PCM 16位Mono 16000 HZ)URL:https://speech.googleapis.com/v1p1beta1/speech:recognize JSON request:strOut:...
我正在使用Google Speech API从语音中获取文本。我也想获取我说的音频文件或浏览器记录的音频文件。我可以得到这个音频文件吗?谢谢。
什么是Python3库,可替换“来自scikits.audiolab导入格式,Sndfile”
希望您会做的很好。我是python的新手。我正在尝试在python3版本中使用audio.scikits库。我在2.7(带有audio.scikits)中有一个工作代码版本。当我运行python3 ...
我如何使用python的语音识别来识别字母而不是单词? [关闭]
我正在编写一个python程序,用户可以在其中逐字母拼写出电子邮件地址。而且,我不知道该怎么做。我读了一个字母,它就能识别一个单词。这里有人吗...
我可以使用语音在本地Django项目中为Google api发短信吗?
助手!我是初学者,没有集成API和项目的经验。我将使用语音为我的项目发送文本google API。因此,我开发了该项目,完成后,我得到了...
实际上,这是我先前提出的问题的扩展。这是将文本转换为音频文件中的语音的工作块。从符号导入参数中导入json ...
Microsoft Speech to Text Python SDK SPXERR_INVALID_HEADER问题
使用azure-cognitiveservices-speech v1.8.0 SDK使用Microsoft Python语音转文本快速入门(“快速入门:从音频文件中识别语音”时,出现以下错误。 ...
[使用Microsoft Azure中的Speech SDK生成Tragncribe ogg文件
我一直在尝试使用Azure认知服务的SpeechSDK来转录(.ogg)文件。但是我不能使它工作。下面是我的代码:将azure.cognitiveservices.speech导入为speechsdk ...
我正在尝试将Speech C#SDK与Blazor一起使用,但是即使在最简单的示例中,我也总是获得NoMatch。 var结果=等待识别器.RecognizeOnceAsync();开关(结果原因)// // >>
很多文字服务(例如Google的语音服务)都提供了置信度得分。至少对于Google而言,它在0到1之间,但是显然不是特定转录是...