speech-to-text 相关问题

将口语翻译成文本。可能的同义词包括自动语音识别,ASR,计算机语音识别,语音到文本,STT。

助理实体和不同的扬声器

这是可能的沃森 - 团结-SDK扬声器/用户进行区分,因为它似乎能够返回指出哪些话是由扬声器在多人说出一个数组...

回答 2 投票 0

如何SpeechSynthesis返回的语言选择列表?

早安大家,我仍在为不识字的人的调查问卷。对于我使用的是文本到语音应用程序(感谢@ JO3-W3B-D3V)的问题是,调查问卷......

回答 1 投票 1

创建为马林凯语言语音识别系统

我想为我的母语(马林凯)创建一个语音识别系统。我怎样才能得到我在我的语言说的认可?是否已有一个平台,让我记录的语音...

回答 1 投票 0

斯诺博伊热词检测问题

嗨,大家好我想触发我的代码while循环每当启动指令“处女座”是说,启动语音识别。问题是,斯诺博伊检测启动指令,但我不知道该怎么...

回答 1 投票 0

如何获得IBM沃森STT服务的身份验证令牌?

我想使用它需要执行下列命令WebSocket的接口按文档VAR令牌= {认证令牌}沃森语音到文本服务; VAR wsURI =“WSS:// ...

回答 2 投票 2

如何与.NET SDK沃森API密钥和URL验证

如何与.NET SDK沃森APIKey和URL(https://gateway.watsonplatform.net/natural-language-understanding/api)(https://github.com/watson-developer-cloud/dotnet-standard-认证SDK)。该...

回答 1 投票 0

我怎样才能改变扬声器标签在IBM沃森演讲的Android文本API?

美好的一天!我需要在我开发Android应用程序的帮助。这是可能的扬声器标签的默认名称更改为一个自定义喜欢一个人的名字。我想创建这样的谈话,我...

回答 1 投票 0

CMU狮身人面像和时间索引的话

我已经运行Pocketsphinx的Python的例子,我现在面对的,我想运行在英语语音识别的60秒的wav文件,并希望作为输出的问题 - 英语翻译 - ...

回答 2 投票 1

如何使用audiofilewritter在IBM华生演讲的Android SDK中发送短信?

我的问题仍然是如何录制的音频文件使用IBM沃森演讲的Android SDK中的文字文本没有例子,我看到的音频文件writter的方法,但对如何没有例子...

回答 1 投票 1

有没有办法在ios 10中使用Speech框架将用户的语音保存为音频文件?

我正在使用ios 10中引入的Speech框架作为我的应用程序中的语音到文本框架。我做了语音到文本的实时转录部分,但我还没有找到一种方法将输入语音保存为音频......

回答 1 投票 0

IBM语音文本 - 如何将MP3音频文件转换为字节数组

IBM演讲文本 - 如何将MP3音频文件转换为字节数组以发送到IBM Watson中的服务器,以使用语音到文本API将音频转换为文本

回答 1 投票 0

用Python转录音频文件

我正在尝试转录一个有点大的音频文件。它的属性如下。大小:278.3 MB持续时间:52分钟格式:WAV Follwoing是我用来转换它的代码...

回答 1 投票 1

从拨出呼叫中捕获麦克风输入并将音频流式传输到api

我正在尝试创建一个应用程序,可以捕获并将麦克风输入流式传输到语音到Android上的传出呼叫文本。我已经有一个代码用于捕获到api的音频流。我现在需要的......

回答 1 投票 -2

在Windows 10中安装pyaudio时出现错误

我是python语言的初学者。我已经在python中编写了一个用于将语音转换为文本的测试函数:def getAudioFromMicrophone():r = sr.Recognizer(),其中sr.Microphone()作为来源:...

回答 2 投票 -1

隐马尔可夫模型用于连续语音中的音素识别

当我有一个孤立的音素时,我知道如何应用隐马尔可夫模型(HMM)。我只需要创建几个HMM模型(每个模型至少有3个状态),每个音素一个,计算前进...

回答 1 投票 1

如何使用google.cloud.speech_v1p1beta1获取整个成绩单?

使用Google-Speech-to-Text,我只能获得部分转录。输入文件:来自google示例音频文件链接到google repo location commercial_mono.wav这是我的代码:def transcribe_gcs(...

回答 1 投票 0

NoSuchMethodError:没有静态方法decodeBase64

我正在开发Marathi聊天机器人,我正在使用Google Translator API和Speech to text。直到昨天应用程序工作正常,但重新启动Android Studio后,出现此错误。我的应用是......

回答 3 投票 1

扬声器标签不一致?即使它只有2个扬声器

当我尝试在演示中转录音频到文本是如此准确这是演示扬声器0中的输出:你好。演讲者1:嗨,这是蒂娜。演讲者0:是的,这是谁。这是我的输出......

回答 1 投票 0

Pocketsphinx - 添加单词并提高准确性

我已经设法最终构建并运行pocketsphinx(pocketsphinx_continuous)。我遇到的问题是如何提高准确性。据我所知,你可以指定一个字典文件(-...

回答 5 投票 17

Azure语音到文本 - Continuos识别

我希望看到Azure语音服务的准确性,特别是使用音频文件的语音到文本。我一直在阅读文档https://docs.microsoft.com/en-us/python/api / ...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.