speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

SpeechRecognizer错误4 ERROR_SERVER-服务器发送错误状态

Google的意思是-“服务器错误”?这不是特别有用的错误。有没有人看过这个错误?我在这里发布代码。该代码通常可以正常工作,并且只有很少的...

回答 1 投票 0

[Unity中有用于Android的听写识别器的API吗?

我需要一个API才能在Unity开发的Android应用中通过麦克风写我所说的话。我已经搜索过,但是我在Unity中看到的所有听写api都适用于Windows。有一个您知道用于Android的API ...

回答 1 投票 0

为什么Azure的文本语音转换太慢?

我正在使用Azure Speech To Text API识别从10秒到1分钟的小口语录音。每个语音识别大约需要5秒钟才能完成,这似乎有点太多了!这是...

回答 1 投票 1

Azure对话转录:userid以$ ref $的形式出现

我正在使用Microsoft语音SDK(及其示例代码)来抄录多参与者对话。转录工作正常,但是它返回$ ref $而不是...

回答 1 投票 0

Microsoft.CognitiveServices.Speech.DetailedSpeechRecognitionResultCollection错误

我们正在使用Microsoft认知服务进行语音转文本的实验。我们的要求之一是拥有字级时间戳。这适用于短的wav文件,例如2-3分钟的音频,...

回答 1 投票 0

使用语音识别来计算口语单词数量的Android应用

是否可以使用某种(离线)语音识别来计数音频文件中的单词?实现这样的最佳方法是什么?而且也有什么方法可以使它...

回答 1 投票 1

[Android应用使用语音识别来计算说出多少个单词

使用某种(离线)语音识别可以计数某些音频文件中的单词吗?做这样的最好的方法是什么?

回答 1 投票 1

训练MS自定义语音模型以识别虚线ID

我想使我的Microsoft自定义语音模型能够识别包含数字,字符和破折号的指示符,如下所示:12-34 A-56 B78。语音模型识别数字和字符...

回答 1 投票 1

我的代码中的问题,如何检查变量是否存在

完整代码将sr adLoop导入Speech_recognition = sr adLoop =真检测器= sr.Recognizer(),其中sr.Microphone()作为来源:detector.adjust_for_ambient_noise(source)print(“ Please talk:”)...

回答 1 投票 -1

Google Speech to Text-无法将输出写入文本文件

我正在尝试写入文本文件。似乎每次都失败。我可以编写.write(“ test”),但是将google转录输出写入文件似乎失败。任何建议都会很大...

回答 1 投票 0

UI在单击按钮后运行语音识别时冻结

我创建了一个python文件,单击开始时,麦克风应该可以工作并开始通话,如果我停止了,它应该将语音转换为文本并将其添加到文本框中,但是每次单击开始时...

回答 1 投票 -1

为什么PyAudio运行这么慢?

以下是脚本,它们一起充当实时语音识别软件。一个在python中,另一个在批处理(Windows)中。它使用PyAudio。每当我第一次创建它们时,它们就起作用了...

回答 1 投票 -1

如何停止Microsoft认知服务-语音-sdk-js停止手动收听?

我已经使用认知服务实现了语音到文本的转换。我需要它在一段时间保持活跃后停止收听。在SDK的C#版本中,有一种方法可以使它成为...

回答 1 投票 0

有没有一种方法可以录制音频并开始听点击声,然后将其存储在我们的本地计算机上并将其从语音转换为文本?

[有没有一种方法可以录制音频并在点击时开始收听,当用户停止讲话时自动停止,将录制的音频存储在我们的本地计算机中,然后将该语音转换为文本,然后...

回答 1 投票 0

语音识别如何识别5和5之间的差异?

我正在尝试制作一个语音计算器,它的使用率约为70%,但问题是,有时而不是5,它看到的字符串是5,然后给了我NaN,因为它不能在a上添加非数字。 ..

回答 1 投票 1

如何使用Mozilla Deepspeech使用其预先训练的模型将语音转换为文本?

我想使用mozilla deepspeech将语音转换为文本。但是输出确实很糟糕。我已经下载了mozilla的训练有素的模型,然后执行的操作是:BEAM_WIDTH = 500 LM_WEIGHT = ...

回答 1 投票 2

Microsoft Speech to Text Python SDK无效标题SPXERR_INVALID_HEADER问题

使用azure-cognitiveservices-speech v1.8.0 SDK使用Microsoft Python语音转文本快速入门(“快速入门:从音频文件中识别语音”时,出现以下错误。 ...

回答 1 投票 0

如何仅获得可识别的文本?

我使用Azure语音在python中输入文本,然后将azure.cognitiveservices.speech转换为speechsdk var = lambda evt:print('ss:{}'。format(evt))speech_recognizer.recognizing.connect(var),然后尝试.. 。

回答 1 投票 0

使用python从头开始构建文本系统的语音

我需要语音转文本系统,以便可以将音频文件转录为文本格式。在研究时,我发现了由大公司(例如Amazon Transcribe,Google Speech to ...

回答 1 投票 0

Google Cloud Speech Command

C#上的[Google Cloud Platform语音命令[listen]和[listen-infinite]]是否可以立即语音识别这两个选项并将其存储在变量中而没有音频记录文件?我要制作...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.