speech 相关问题

言语是人类交流的发声形式。

使用 python 3.5 进行语音文本转语音

是否可以以某种方式使用 python 3.5 的文本到语音 重要讲话 导入时间 response = voice.input("请说点什么。") Speech.say(“你说”+回复) def 回调(短语,

回答 3 投票 0

我尝试在语音合成中改变声音

我尝试更改默认语音,但它没有改变。 让语音 = new SpeechSynthesisUtterance(); 让声音 = window.speechSynthesis.get...</desc> <question vote="1"> <p>我尝试更改默认语音,但它没有改变。</p> <pre><code>&lt;script type=&#34;text/javascript&#34;&gt; let speech = new SpeechSynthesisUtterance(); let voices = window.speechSynthesis.getVoices(); let notify_audio = new Audio(&#34;ascend.mp3&#34;); notify_audio.setAttribute(&#39;muted&#39;,true); notify_audio.setAttribute(&#39;autoplay&#39;,true); document.querySelector(&#39;body&#39;).appendChild(notify_audio); document.querySelector(&#34;#start&#34;).addEventListener(&#34;click&#34;,() =&gt;{ notify_audio.setAttribute(&#39;muted&#39;,false); notify_audio.play(); setTimeout(function(){ speech.voice = voices[4]; speech.text = document.querySelector(&#34;#texta&#34;).value; speech.rate = 0.9; window.speechSynthesis.speak(speech); },1000) }) console.log(speech); &lt;/script&gt; </code></pre> <p>我试过这个</p> <pre><code>speech.voice = window.speechSynthesis.getVoices()[4]; </code></pre> <p></p><div data-babel="false" data-lang="js" data-hide="false" data-console="true"> <div> <pre><code>let speech = new SpeechSynthesisUtterance(); let voices = window.speechSynthesis.getVoices(); let notify_audio = new Audio(&#34;ascend.mp3&#34;); notify_audio.setAttribute(&#39;muted&#39;,true); notify_audio.setAttribute(&#39;autoplay&#39;,true); document.querySelector(&#39;body&#39;).appendChild(notify_audio); document.querySelector(&#34;#start&#34;).addEventListener(&#34;click&#34;,() =&gt;{ notify_audio.setAttribute(&#39;muted&#39;,false); notify_audio.play(); setTimeout(function(){ speech.voice = voices[4]; speech.text = document.querySelector(&#34;#texta&#34;).value; speech.rate = 0.9; window.speechSynthesis.speak(speech); },1000) }) console.log(speech);</code></pre> <pre><code>&lt;textarea id=&#34;texta&#34;&gt;parent!! number 27!! please go to Students Affairs&lt;/textarea&gt;&lt;br&gt; &lt;button id=&#34;start&#34;&gt;start&lt;/button&gt;</code></pre> </div> </div> <p></p> <p>控制台日志</p> <p>郎:“” 边界:空 一端:空 错误:空 标记:空 暂停:空 恢复时:空 启动时:空 节距:1 率:0.8999999761581421 短信:“家长!!27号!!请到学生事务处” 声音:空 体积:1</p> </question> <answer tick="false" vote="0"> <p>好吧,我找到了这个,它对我有用</p> <pre><code>window.speechSynthesis.onvoiceschanged = function() { voices = window.speechSynthesis.getVoices(); }; </code></pre> <p>我在这里发布这个也许有帮助</p> </answer> </body></html>

回答 0 投票 0

Python 语音识别在处理短发音单词时遇到问题

我有一个项目,我正在使用语音识别模块。我注意到识别器在处理短发音单词的输入时遇到问题,例如“next”、“search”、“...

回答 1 投票 0

通过 Wifi 传输语音流

我一直在尝试通过 wifi HTTP TCP/IP 以 16Khz 传输语音(可能扩展到音频)。考虑到 ESP8266 wifi 模块与 Arduino 和其他平台的兼容性,我开始使用 ESP8266 wifi 模块...

回答 1 投票 0

设置 SFSpeechAudioBufferRecognitionRequest.requiresOnDeviceRecognition = true 时接收错误“Domain=kAFAssistantErrorDomain Code=1101”

如果我设置 SFSpeechAudioBufferRecognitionRequest.requiresOnDeviceRecognition = true,我将收到下一个错误:Error Domain=kAFAssistantErrorDomain Code=1101。 为了测试它,你可以

回答 2 投票 0

如何在简单语音示例应用程序(ATT 语音 API)中添加凭据

如何在speechConfig.m(一个简单的语音示例应用程序ATT语音API)中添加凭据? /** 取消混淆应用程序的 OAuth client_id 凭证。 **/ NSString* SpeechOAuthKey(...

回答 1 投票 0

用于语音转文本(语音识别)iPhone 的 API 或 SDK

我想要一个语音识别API或SDK来识别用户所说的语音并给出它的文本形式。 详细说明如下: 在我的应用程序中,我需要播放音频...

回答 3 投票 0

Librosa 抛出 ValueError

x_val, s_rate = librosa.load(文件名, sr=采样率) 文件“/python3.6/site-packages/librosa/core/audio.py”,第 140 行,位于 加载 y = sf_desc.read(frames=frame_duration, dtype=dtype,

回答 1 投票 0

语音识别Python出现奇怪的请求错误

以下代码的语音识别根本不起作用 以 sr.Microphone() 作为源: # 从默认麦克风读取音频数据 音频= r.record(源,持续时间= 4) 打印(“

回答 2 投票 0

Azure Speech SDK 使用 golang 将语音转换为流中的文本

在 golang 中使用 Azure Speech SDK 语音转文本时。 我想使用流中的数据 但输出超时。 如何修复它? base64Data := "xxxx" audioBytes,错误:= base64.StdEncoding.DecodeSt...

回答 1 投票 0

将转录文本与音频中的特定时间戳对齐

在 Azure 中是否可能,或者 Azure 中是否有服务可以用来根据源视频的口语获取每个纯文本的位置? 基本上,我有一个纯文本可以...

回答 1 投票 0

Swift:沉默 x 秒后停止语音识别

我一直在寻找解决方案,但我看到的所有解决方案都很令人困惑,所以我想我应该创建一个新问题。 我正在使用语音库,我希望识别任务在 2 秒后停止

回答 3 投票 0

识别音频文件中的重复句子

我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。 假设有人正在录制自己说的文字,有时他会被一句话噎住......

回答 1 投票 0

是否可以“按您所说”转录 Twilio 通话?

有谁知道 Twilio 是否可以在通话期间根据一种音频标志或模式(例如静音)创建多个音频记录。这样您就可以触发回调...

回答 2 投票 0

在 RPi3B+ 上使用 Google Cloud SpeechRecognition 和 python 3.9 实现 80 秒延迟

我正在使用PyPi代码(https://pypi.org/project/SpeechRecognition/) 清理后仅使用 Google Cloud SpeechRecognition。 Google Json Credentials 在 shell 环境中并且正常工作。 我已经...

回答 1 投票 0

如何根据不同的说话者分离音频文件

我有一堆关于电话交谈的音频文件。我想尝试将一个音频文件分成两个,每个文件只包含一个演讲者的讲话。也许我需要使用语音分类。但如何...

回答 2 投票 0

如何在Python中将文本转换为语音

我现在想知道如何在Python中将文本转换为语音。 在.NET中我使用了 暗淡SAPI Msg = '嗨,这是一个测试' SAPI = CreateObject("sapi.spvoice") SAPI.Speak(消息)

回答 8 投票 0

Google Speech-To-Text v2 不接受 Node.JS 中的音频

我已经尝试了几天使用 Node.JS 迁移到 Google STT V2。在 v1 中一切都很完美。我创建了一个识别器并使用 https://github.com/

回答 1 投票 0

TENSORFLOW 语音命令:解码 wav 时出现错误(尝试读取字符串时数据太短)

感谢您的帮助。 我正在学习张量流上的tuturial(语音命令),在我下载代码和数据集之后,我运行程序,经过几个步骤的训练,出现错误...

回答 3 投票 0

如何中断应用程序中文本语音合成的播放?

这是我用来语音richTextBox 的代码。我的问题是,在播放文本时我无法单击任何内容。我什至无法停止玩。我该如何解决这个问题?有什么办法可以...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.