speech 相关问题

言语是人类交流的发声形式。

训练级联自定义语音-无故失败

我正在创建具有6,023话语的Azure自定义语音,允许我选择“连接”选项进行培训。它运行了大约24小时,然后失败了。问题是它没有提供理由...

回答 1 投票 -1

如何将识别结果保存到文件中?

我不是程序员。但是需要识别文本中的音频文件。我使用Gcloud控制台识别了音频文件。但是,当我尝试将结果输出到控制台时,...

回答 1 投票 0

SFSpeechRecognizer在IOS 13.2中无法正常工作

在IOS 13.1中,一切正常。从13.2开始,SFSpeechRecognizer使我很难受。语音识别比以前花费更长的时间和结果。我...

回答 1 投票 0

在luis和qna的现有分派模型中启用语音

我让我的网络应用程序机器人处理分发模型。我希望我的机器人也可以在同一网络频道中使用语音输入。那么如何在现有架构中实现呢?

回答 1 投票 0

JS AzureSDK创建自定义函数以捕获语音,显示文本结果和结果的置信度

我需要创建一个简单的javascript函数来捕获输入,然后使用AzureSDK以置信度百分比返回文本。我最大的问题是我是编码新手,这是...

回答 1 投票 0

iOS10:语音识别器不准确

SFSpeechRecognizer不正确。我添加了上下文字符串。但是没有帮助。而且在didFinishRecognition中被调用非常慢。 didHypothesizeTranscription将返回不正确的文本。 ...

回答 1 投票 1

如何使用Azure语音批量转录文本-Python代码

我在使用Azure语音到Python中的文本Api REST连接天蓝色斑点时遇到问题。如果有人在Python中提供了示例代码,如果您能帮我一下,我将不胜感激。...

回答 1 投票 -1

为俄语文本到语音的良好翻译提供咨询服务

我想在C#中添加具有良好语音合成的功能。我发现了3种方法,但是语音质量还有很多不足之处,或者这是一项付费服务 ...也许您知道一些免费服务...

回答 1 投票 0

如何在不单击键盘上的任何麦克风按钮的情况下直接在主应用程序中被siri识别为文本的语音

[siri可以识别的语音中其余的“ hey siri”除外,应在主应用程序中将其打印在标签中,如果需要自定义意图,请指定操作方法,等待解决方案谢谢。

回答 1 投票 -4

可以与网络音频API一起使用网络语音API?

是否有可能使用来自网络语音API合成语音的网络音频API的音频上下文里面SourceNode?

回答 2 投票 14

无法运行在Windows 7中的python 3.6语音模块?

我使用python 3.6和我都面临着在Windows 7中导入语音进口SYS进口OS进口numpy的导入语音模块为NP进口pyttsx3计数器= 0,而真正的错误:...

回答 1 投票 0

如何在Bixby上控制语音输出

我正在使用Bixby Developer Studio,并且创建了UI输出,并且可以正常工作。如何创建或控制语音输出?

回答 2 投票 1

如何使用语音识别,而不在Android手机烦人的对话框

这是可能的,而不修改了Android的API?我已经找到了这篇文章。有一个评论,我应该做修改了Android的API。但它并没有说怎么办?

回答 4 投票 116

在C#中,请求允许语音识别Xamarin的Android时,我得到一个错误

所以,我现在用的是Plugin.SpeechRecognition NuGet包和下面就行,它不工作的确切的代码。我曾尝试加入“Plugin.Permissions” NuGet包并没有帮助...

回答 1 投票 0

在蟒蛇的话斯普利特语音音频文件

我觉得这是一个相当普遍的问题,但我还没有找到一个合适的答案。我有人类语音的多种音频文件,我想就突破的话,它可以通过启发式做...

回答 4 投票 15

Azure 文本转语音 API - 仅限 10 分钟的音频?

可以提交给 TTS(神经)语音服务端点的文本数量是否有限制? 我从 Azure Functions 发出的所有请求都是成功的,但截止日期为...

回答 3 投票 0

Pocketsphinx VS Google语音识别API

我正在构建一个语音识别Android应用程序,它将充当虚拟个人助理,其任务包括:预约/提醒天气信息一般查询Wolfram | Alpha / ...

回答 2 投票 7

读取本地音频文件STT Google语音转文本

我没有找到如何使用curl命令行中的Google STT发送本地文件。如他们的tuto所示,这里是我的request.json:{“config”:{“encoding”:“FLAC”,“sample_rate”:16000,...

回答 1 投票 0

添加新字符串时,AVSpeechSynthesizer无法正常工作[xcode - swift 4]

我使用下面的代码随机读取随机句子。然而,当一个随机的句子被调用时,我遇到了问题,而前一个句子仍在被...

回答 1 投票 0

来自文件或流的UWP语音识别

我创建了一个UWP应用程序,能够对从麦克风接收的音频执行语音转换。但是,我的目标是从文件或流中进行语音识别。从我所看到的......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.