speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

使用 python、django、openai、语音识别的聊天机器人 [关闭]

我已经使用语音识别、openai、pyttsx3 实现了虚拟协助。它在控制台上工作,我想使用 django 创建一个网络应用程序。 控制台结果

回答 0 投票 0

如何让支持语音的机器人从 Azure 语音服务接收大写和标点符号的文本

我有一个使用 Azure 语音服务的机器人和客户端应用程序。当我与客户端应用程序交谈时,语音服务将语音到文本的结果返回给客户端,其中包含完整的标点符号和大写字母...

回答 1 投票 0

(Mis)-使用 open.ai whisper 进行文本到文本的翻译

我注意到使用 openai whisper 语音转文本库以多种语言转录语音有时可以准确识别另一种语言的插入内容并提供预期的输出...

回答 1 投票 0

仅使用 Google Speech to Text API 中的项目密钥访问位置

我正在做一个项目,我正在使用 Google 的 Speech to Text API。 我想为我选择的一些词分配提升值 我为此使用了 SpeechAdaption。 但是她的问题...

回答 0 投票 0

react-native-voice - 语音转文本在 android 中不起作用

我正在使用 react-native-voice 和 expo-speech 库来转录我的声音并将文本转换为语音。问题是,仅在 android 中,当我启动代码时运行 Voice.onSpeechStarts

回答 2 投票 0

如何在 C# 中使用 OpenAI Whisper

我是 C# 新手 我想在 C# 中制作语音助手并使用 Whisper 进行语音转文本。 我想在 C# 中使用 IronPython 来使用 Python,因为我不能在 C# 中使用 Whisper。 这是我的 python 代码: 进口

回答 1 投票 0

如何通过 fetch 或 axios 获取音频文件缓冲区并在 google speech to text 中使用它?

我有以下代码: 异步函数 transcribeAudio(audioLink) { const audioFile = await fetch(audioLink); const audioBuffer = await audioFile.buffer(); const client = 新演讲。

回答 0 投票 0

使用 RecognitionAudio.FromStream() 时出现错误消息“调用者没有权限”

当我像下面这样使用 fetchFromUri 时,我已经成功地从我的代码中使用 google Speech-to-Text API 转录了一个音频文件: var file = RecognitionAudio.fetchFromUri(fileUri); 变量

回答 0 投票 0

How to train azure speech to text model on localhost

需求,我无法使用云上的azure speech to text服务。因此,我使用 azure speech 到带有 docker 的文本容器。我用两张图片 1.mcr.microsoft.com/azure-cognitive-services/

回答 1 投票 0

人工音频数据库的使用

大家好,我将建立机器学习模型来对阿拉伯语进行音频情感分析,阿拉伯语在语音数据库中遭受贫困,所以我想生成一个人工制品......

回答 0 投票 0

来自 http Stream 的语音识别服务 wav 文件

当我尝试将 wav 文件从 url 下载到 AudioInputStream 时,转录结果非常差。 HttpResponseMessage wavresponse = await _httpClient.GetAsync($"{recordingUrl}.wav&qu...

回答 0 投票 0

是否可以限制SFSpeechRecognizer的词汇量?

我想使用 ios SFSpeechRecognizer 来识别一组封闭的单词和短语。有没有办法指定这些并删除所有其他可能性?我似乎找不到办法做到这一点。

回答 3 投票 0

如何使用 Java 将 ogg 文件从电报语音消息转换为 wav?

我在 Github 和 Google 上搜索,但没有找到好的解决方案。 我正在编写一个 Telegram 机器人,并希望使用 Microsoft 的语音到文本 java sdk 将用户的语音消息转录为文本

回答 0 投票 0

满足条件时在某个时候更改库版本

在 python 中是否可以在满足条件时在运行时更改库版本。就我而言,我使用的是谷歌语音转文本 (STT)。我正在使用 speech_v1 但有一些功能......

回答 0 投票 0

如何使用语言模型进行语音识别

我正在使用 emd 语音识别系统。我有 .lm 扩展 a 和其他推理和发音模型的语言模型。我希望它从中做出预测

回答 0 投票 0

在训练自动语音识别模型的同时,降低单词错误率。

我正在训练一个语音到文本的模型。在第一个纪元,WER是0.33,第二个纪元WER还是一样,但是训练损失增加了,而验证损失减少了。...

回答 1 投票 1

使用Postman将Watson语音转为文本

我试图用法语模式转录一个音频,这是我的curl命令: curl -X POST -u "apikey:**********************" --header "Content-Type: audiomp3" --data-binary @C:\...。

回答 1 投票 0

语音识别onRmsChanged得到的值为负数。

我正在尝试识别语音。它的工作,但几秒钟后,它自动断开,并给出rms值-2.12。如果我们再次开始重新连接,它给我一个异常。这是我的MainActivity...。

回答 1 投票 4

找不到GOOGLE_APPLICATION_CREDENTIALS。

目前必须将Google云平台服务集成到我的应用程序中,但收到以下异常。**WSystem.err: java.io.IOException.The Application Default Credentials are not ..: 应用程序默认凭证不 ...

回答 1 投票 1

微软认知语音转文本 - 不能转换整个.wav文件。

当试图转换一个个人的.wav文件时, 只有一小部分语音被转换为文本 而且每次转换都在相同的地方停止. 我一直没有找到任何在 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.