speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。


如何在不关闭GUI的情况下停止执行方法?

我正在尝试将IBM Watson语音文本API集成到GUI项目中。我正在使用他们文档中提供的示例代码(如下所示)来请求转录。我复制了此...

回答 1 投票 0

我如何修复AttributeError:'NoneType'对象没有属性'lower'?

[每次我运行旨在构建弱Ai平台的代码时,我都会收到AttributeError:'NoneType'对象没有属性'lower',而且我完全不知道为什么它在...中可以正常工作...] >

回答 3 投票 0

如何访问Microsoft Speech SDK记录的音频流

我正在使用Microsoft的Speech SDK for JavaScript转录麦克风流。录制和转录都是使用Speech SDK完成的,我还无法找到一种方法...

回答 1 投票 1

Android的Google Speech-to-Text API使用RPC beta自动检测语言

我正在尝试为Android实现应用程序,该应用程序将使用具有语言自动检测功能的Google Cloud Speech To Text API。在官方文档中,我找到了适用于Android的示例项目。但是问题是...

回答 1 投票 1

使用Python获取从Azure语音到文本服务的审查词的时间戳记

如何通过使用Python的Azure语音到文本服务在音频文件中获取经过审查的单词(亵渎)的偏移量和持续时间(亵渎)?我可以看到转换后的文本中的脏话是...

回答 1 投票 0

我如何在Python中进行实时语音活动检测?

我正在对记录的音频文件执行语音活动检测,以检测波形中的语音与非语音部分。分类器的输出看起来像(高亮的绿色区域...

回答 4 投票 3

我为什么不断收到AttributeError:'NoneType'对象没有属性'lower'?

[嗨,我正在研究类似于Siri和Cortana的弱Ai,但是我注意到我一直收到“ AttributeError:'NoneType'对象没有属性'lower'”,与此同时,这也代替了我的代码...] >

回答 1 投票 0

是否有用于访问Mac OS X Mavericks中增强听写的API(或任何黑客手段?)>

[我正在尝试找到一种将音频文件转录为文本的简单方法(CMU Sphinx,Julius等。对于不了解语音识别,配置语言模型,声学...的人来说很难。

回答 3 投票 4

语音识别代码仅对我2分钟的wav文件说了几句话

我正在运行以下代码来转换2分钟的语音。但是,它仅返回几句话,并且看不到“以退出代码0结束的过程”。较长的文件也会发生相同的情况。 ...

回答 1 投票 0

java.io.IOException:环境变量GOOGLE_APPLICATION_CREDENTIALS必须指向指向定义凭据的文件

我想在其中使用google cloud cloud语音api和android应用程序,而我正在跟踪google https://cloud.google.com/speech-to-text/docs/libraries#client-libraries-install- java I ...

回答 1 投票 0

从Azure Speech到Text Rest API创建语音服务

我可以在Microsoft文档链接中看到用于语音到文本的REST API端点的两个版本。 https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/batch -...

回答 1 投票 0

实时语音活动检测

我正在对记录的音频文件执行语音活动检测,以检测波形中的语音与非语音部分。分类器的输出看起来像(高亮的绿色区域...

回答 1 投票 2

不推荐使用Python语音识别器Recognize_ibm,替代方法?

自1月以来,由于IBM更改了他们的授权系统,ognize_ibm函数不再起作用。由于与Google相比,它的运行速度非常快,我想知道是否有任何一个...

回答 1 投票 1

对于给定的少量单词(大约100个单词),有没有一种实现语音转换为文本的方法?

我正在尝试避免使用AWS和Microsoft这样的云服务,因为我不需要它们的大多数功能。我只有一小部分我想使用...

回答 1 投票 1

IBM-Watson文字语音转换引发“ 403:禁止”错误

我正在尝试使用IBM watson api进行文本到语音服务。如果我使用curl命令,该服务将起作用,但是当我尝试使用Python SDK使用srrvice时,它将抛出以下错误。追溯(最...

回答 1 投票 0


在python中具有语音识别功能的多个短语

我已经在下面发布了完整的代码,我希望能够重复执行audio = r.listen(source)。我已经得到重复的代码,但每次都会返回相同的内容。我...

回答 1 投票 0

IBM Watson语音转文本“识别音频”方法?

如何使用识别方法将音频文件发送到语音转文本以进行转录?音频文件在哪里访问?是否有地方可以放置本地文件的路径,即Google Storage ...

回答 1 投票 0

IBM Watson IAM令牌是对所有服务有用还是特定于每个服务,例如,语音转文本?

IBM的文档说,下面的Node后端代码使您能够使用API 密钥来使SDK管理令牌的生命周期。 SDK请求访问令牌,确保...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.