将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。
在我的 Flutter 应用程序中,我有一个包含各种 TextFormFields 的表单,每个表单域都有一个麦克风来转录所说的内容。 我用 SpeechToTextProvider 实现了它。 当我按下麦克风时,它会写...
我对语音转文本感到疯狂。 在我的应用程序中,我有各种表单,每个表单都有各种 TextFormFields。 对于每个输入,我都必须连接一个麦克风,以便我可以转录所说的内容。 我有
Harakat,阿拉伯语 Tashkeel,语音转文字。颤动
我正在 flutter 项目中使用语音转文本。 我有一个问题,我需要用 harakat 识别阿拉伯语语音到文本,但它没有发生。我如何用阿拉伯语 tashkeel 识别阿拉伯语(haraka...
我正在通过 Azure 认知服务语音 SDK 使用连续语音翻译构建一个简单的 Python 应用程序。据我所知,语言之间的翻译和检测是有效的......
我正在使用speech_to_text,它在网上非常好 ,但我希望它可以离线工作,如何在 Flutter 中实现这一点? 根据包的自述文件 在谷歌应用程序中 安装谷歌应用程序 设置 > 语音...
无需使用 azure 或 google 服务 api 即可将语音转为文本
干草, 有什么方法可以让我有一个 mp3 音频文件(孟加拉语),并且我想转录它并以文本或文本文件的形式获取输出。 我有 GitHub 学生包和 azure。但我不想...
我正在尝试使用适用于 iOS 的 Microsoft 认知服务语音转文本 SDK。到目前为止,我已经设法让 recognizeOnce 函数运行没有任何问题,但 Swift 的示例是...
如何使用 Vosk 获取已知转录文本的音频文件中单词的开始和结束时间?
我在Python中使用Vosk(https://alphacephei.com/vosk/),我想获取音频文件中每个单词的开始和结束时间,并且我有音频文件的转录。 我正在使用一些代码我...
使用React中的Web Media Recorder API作为前端,使用Python作为后端来实现实时语音识别
我们要实现什么? 我们部署了一个人工智能模型来传输麦克风中的音频并向用户显示语音文本。像这样的东西。 使用什么技术? 蟒蛇...
任何人都可以检查我的代码是否有错误:这是为微软语音 API 传递字节,但是我收到了 400 bad request 错误。 wav 文件格式是正确的,因为我使用了
在我的 Flutter 应用程序中,我有一个包含各种 TextFormFields 的表单,每个表单域都有一个麦克风来转录所说的内容。 我用 SpeechToTextProvider 实现了它。 当我按下麦克风时,它会写...
我开始使用谷歌语音API来转录音频。 正在转录的音频包含许多依次说出的数字。 例如。 273298 但转录结果是 270-3298 我的咕...
Flutter:如何处理表单中的 SpeechToTextProvider 并单独重建每个输入
在我的 Flutter 应用程序中,我有一个包含各种 TextFormFields 的表单,每个表单域都有一个麦克风来转录所说的内容。 我用 SpeechToTextProvider 实现了它。 当我按下麦克风时,它会写...
Flutter:如何使用表单管理speech_to_text
在我的 Flutter 应用程序中,我有一个将数据保存到 Firestore 的表单。 用户必须能够通过书写或口头输入数据。 为此,我将 voice_to_text 插件附加到表单中。 ...
是否可以使用“speech_to_text”库在用户句子结束后设置结束音频输入的时间?
我正在编写一段代码来识别用户的语音,并据此在应用程序中做出决策,但我们知道,当我们说话时,我们可以短暂中断,以便更好地思考问题...
我正在寻找一个准确率 > 95% 且平均响应时间的语音识别库 < 400ms. This is needed for one of my native ANDROID app which has been running on propriety
Flutter:带有表单的 SpeechToTextProvider
我对语音转文本感到疯狂。 在我的应用程序中,我有各种表单,每个表单都有各种 TextFormFields。 对于每个输入,我都必须连接一个麦克风,以便我可以转录所说的内容。 我有
我正在使用流音频和 wav 文件测试 google Speech-to-Text API。 我正在使用电话音频:8000 采样率、8 位、mulaw 编码。 Google 配置已设置
使用 Twilio 和 Deepgram 进行实时电话通话转录
使用 Twilio 媒体流,我想转录拨出呼叫。为了转录实时音频,使用了 Deepgram 转录 API。我很好奇 Twilio 流返回的音频类型......
当我开始我的活动或片段时,我想开始语音识别,当用户说话时,如果它与某个字符串匹配,则会显示结果。结果出来后,它应该再次开始识别...