将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。
当我开始我的活动或片段时,我想开始语音识别,当用户说话时,如果它与某个字符串匹配,则会显示结果。结果出来后,它应该再次开始识别...
我有一个 Flutter 应用程序,可以在 Android 和 iOS 上运行。 在 iOS 上一切都很完美。但在 Android 上我遇到了一些语音转文本的问题...... 我正在使用这个插件:https://pub.flutter-io.cn/
我正在开发一个使用 gTTS 的语音识别项目。问题是,当我运行代码时,系统没有响应。 (它不会回答我的查询)我根据我的知识尝试但不能
我正在做一个项目,该项目的主要特点是语音识别。后端采用node、express、mongo DB开发,前端采用react-native。我做了一个l...
Microsoft Speech SDK 即使在转录后仍在使用音频文件,如何知道何时停止使用该文件?或者如何强制它停止?
我正在使用 Microsoft 语音 SDK 来转录音频波文件,我通过 API 接收二进制文件。我试图直接从这种格式中受益,但我无法将其作为...
我们的应用程序“ConverStory”的语音识别器部分最近突然停止在某些设备上工作。 https://play.google.com/store/apps/details?id=com.converstory。我们使用...
我正在构建一个 Android 应用程序,并且正在使用语音识别,但虽然该应用程序在 Android 11 及以下任何版本上运行良好,但我遇到了 Android 12 以外的任何版本的障碍。
在我的 Flutter 应用程序中,我有一个将数据保存到 Firestore 的表单。 用户必须能够通过书写或口头输入数据。 为此,我将 voice_to_text 插件附加到表单中。 ...
有没有一种方法可以使用 flutter 将语音转换为文本(特别是如果是阿拉伯语语音并且我也想要阿拉伯语的结果文本)我找到了许多资源来解释语音如何...
导入错误:Python IDLE 中没有名为“speech_recognition”的模块
我正在尝试使用Python 3.5.1的语音识别模块来让我的jarvis AI语音激活!我查看了堆栈溢出并发现了一些与我类似的问题,但他们没有......
如何使用 Whisper 转录多语言音频文件而不翻译任何内容?
我正在尝试使用 Whisper 库转录一个音频文件,其中包含交替的英语和印尼语语音。 一些印尼语演讲被正确转录成印尼语...
如何根据音频文件添加时间戳到转录文件中? (结果是srt文件)
我使用语音转文本API,使用Python脚本为音频ideo(带有时间戳的字幕)制作srt文件。但它并不是 100% 准确。我有准确的音频文件转录(它有一些
我正在使用下面的代码使用 Azure 语音到文本服务将语音转换为文本。我想将我的音频文件转换为文本。下面是相同的代码: 导入操作系统 导入 azure.cognitivese...
如何增加Microsoft Speech Service SDK一次性监听的时间?
我正在使用MS语音服务sdk进行语音到文本的转换。当我说话时,即使我没有停止说话,我的讲话也会在 60 秒后转换为文本。它基本上认为它是一chun...
有没有一种流畅的方法可以在Raspberry Pi 5上集成两个Python脚本?第一个脚本涉及语音识别,将口语单词转换为文本。第二个脚本将文本转换为 G...
语音转文本:google.api_core.exceptions.PermissionDenied:403
我正在尝试使用Google语音转文本服务,根据https://googleapis.github.io/google-cloud-python/latest/speech/index.html 我已经创建了项目,将音频上传到gs:cloud,添加了
我在 Node js 中使用 Google 的 Speech-to-Text API。它返回前几个单词的识别结果,但随后忽略音频文件的其余部分。截止点是任何
我正在尝试使用流音频输入谷歌的语音到文本。 我有一个简单的 JS 代码,该代码在按下按钮时记录音频并使用 websockets 将音频发送到 fastapi 后端。在 fastapi 中...
我有一个项目,我正在使用语音识别模块。我注意到识别器在处理短发音单词的输入时遇到问题,例如“next”、“search”、“...
为什么使用 SpeechRecognizer 时 SpeechSynthesizer 不起作用?
这显然是其他几篇文章的重复,但它们都已经有好几年了,而且他们的解决方案都不适合我。 我正在使用 SpeechSynthesizer 和 SpeechRecognizer。认出后...