text-to-speech 相关问题

文本到语音或语音合成是人类语音的人工产生。

有什么方法可以将flutter_tts文件保存到firebase存储中吗?

我正在开发一个 flutter 项目,其中用户应该创建一些脚本并通过在文本中输入它们,然后 flutter_tts 库应该将它们转换为工作正常的音频文件...

回答 2 投票 0

在小型训练数据集上训练的文本转语音模型

我需要一个模型,可以使用包含转录本和最多 20 个句子的 wav 文件的数据集进行训练。 我尝试在这样的数据集上训练 https://github.com/coqui-ai/TTS,但它...

回答 1 投票 0

SpeechSynthesizer 没有在 Swift 中提供完全停止的自然停顿

我正在执行一项文字朗读任务。我面临的问题是,如果我收到以下文本:大家好。还剩 2 分钟。然后使用下面的代码进行语音合成器,它考虑什么...

回答 1 投票 0

适用于 iOS 的带有儿童语音的文本到语音框架

我正在尝试使用 Swift 构建一个儿童游戏。我想在我的应用程序中使用文本转语音 API,但我通过的所有 API 都是男性或女性机器人的声音。有没有API可用...

回答 1 投票 0

使用 Conda 安装 Tortoise TTS 时出错(仅限 CPU PyTorch 安装)

我一直在尝试在带有 AMD 集成显卡的本地计算机上安装 Tortoise TTS,因此从网站上看,因为我没有 NVIDIA GPU,所以无法安装 CUDA 版本,也无法使用 ROCm 版本。 ..

回答 1 投票 0

泰卢固语单词不发音

我想创建一个可以发音泰卢固语字母的网站。即使代码没有显示任何错误,它也不会发音给定的字母。 我尝试了以下代码,但没有成功 //

回答 1 投票 0

如何在Python中将文本转换为语音

我现在想知道如何在Python中将文本转换为语音。 在.NET中我使用了 暗淡SAPI Msg = '嗨,这是一个测试' SAPI = CreateObject("sapi.spvoice") SAPI.Speak(消息)

回答 8 投票 0

加载音频失败:[WinError 2]找不到指定的文件。右室VC

尝试使用 rvc_convert 将带有文本的音频转换为我自己的 AI 模型,但它失败并给我带来了这个异常: 回溯(最近一次调用最后一次): 文件“f:\python\py ts env\src vc\lib udi...

回答 1 投票 0

将 Google Cloud 文本转语音集成到 Android 项目中

我在集成 Google Cloud TTS 时与类重复发生冲突(下面的 Gradle 片段)。找不到此问题的工作解决方案。这个例子对我不起作用,我什至无法构建这个...

回答 1 投票 0

如何在MAUI中实现语音转文本?

我想在.Net MAUI 中将语音转换为文本。我搜索相同的内容但没有找到解决方案。 请让我知道如何实施。 我点击此链接:https://devblogs.microsoft.com/dotnet/s...

回答 1 投票 0

通过 ISpTTSEngine 与 ISpVoice 通话

我正在为 Microsoft Speech API (SAPI) 实现 ISpTTSEngine。我想要 这个声音就像典型的 TTS 声音一样进行报读。而不是写我的 自己的语音合成器,我想要

回答 2 投票 0

Azure 文本转语音:错误代码:1007。错误详细信息:SSML 必须包含最多 50 个语音元素

我使用 Azure 文本转语音,但出现以下异常: 错误代码:1007。错误详细信息:SSML 必须包含最多 50 个语音元素。实际90。 但我的 SSML 仅包含 45 个语音元素。

回答 1 投票 0

Asure Text to Speech:错误代码:1007。错误详细信息:SSML 必须包含最多 50 个语音元素

我使用 Asure 文本转语音,但出现以下异常: 错误代码:1007。错误详细信息:SSML 必须包含最多 50 个语音元素。实际90。 但我的 SSML 仅包含 45 个语音元素。

回答 1 投票 0

用于女声文本转语音的Java代码

我想要java代码用于男性和女性声音的文本到语音转换,之后我想将该音频保存到wav文件。我尝试使用此代码,但它只能发出男性声音。 请给我推荐一个w...

回答 1 投票 0

Microsoft Azure TTS 认知服务语音限制问题

我对 Microsoft Azure 的文本转语音 (TTS) 认知服务非常陌生。我成功地使用 Azure 的 TTS 服务将给定的文本转换为音频文件。它工作正常...

回答 2 投票 0

Azure 文本到语音 API 音频输出未播放

我是 Azure 和一般编程的新手。 背景 我正在构建一个 Google Sheet 应用程序脚本,它将 Sheet2!B1 的内容发送到 Azure Speech API,并将生成的语音输出到 Sheet2!B2。

回答 1 投票 0

pyttsx3 打印当前说出的单词

我基本上希望 tts 说话的同时打印出它所说的内容。 我几乎复制并粘贴了 pyttsx3 文档来执行此操作,但它不起作用。 导入 pyttsx3 def onStart(...

回答 2 投票 0

React Native - 无法同时使用语音转文本和文本转语音

我正在使用react-native-voice和expo-speech库来转录我的声音并将文本转换为语音。问题是,当我结束注册我的声音并开始使用 expo-v 演讲时......

回答 2 投票 0

无法使用 Google TTS 生成非拉丁字符

我创建了一个 python 脚本来使用 .csv 作为数据源生成音频。该脚本在生成英语/西班牙语音频时已得到验证,但我无法在 Telegu 中生成单词。 我的...

回答 1 投票 0

双向流连接无法与 Gather 一起使用

我正在使用电话号码语音 webhook,做出如下 TwiML 响应: 我正在使用电话号码语音 webhook,做出如下 TwiML 响应: <?xml version="1.0" encoding="UTF-8"?> <Response> <Connect> <Stream url="wss://..."/> </Connect> <Gather speechTimeout="auto" speechModel="phone_call" enhanced="true" input="speech" action="/respond"/> </Response> 它正在正确启动双向语音Stream,没有任何问题。它能够连接、发送数据和断开连接。但它没有在 Gather 部分提出任何“/respond”请求。如果我删除 Stream 连接部分并将 TwiML 更新为: <?xml version="1.0" encoding="UTF-8"?> <Response> <Gather speechTimeout="auto" speechModel="phone_call" enhanced="true" input="speech" action="/respond"/> </Response> 然后 Gather 被呼叫。但为什么不使用双向 Stream 来调用呢? 问。我们想要什么? 要么: 完全通过流来完成吗? 我在一个地方获取 StreamId、ConnectionId、CallId 时遇到问题。 像我一样使用Gather? 这里使用 BiDirectional Stream,由于某种原因甚至没有调用 Gather。 问。为什么使用Gather? 目前,我们正在使用已经训练好的 speechTimeout 和语音 model 在用户停止说话时获取 que。在 Gather 步骤中,我们向另一个 API 端点发出请求,在“StreamId”、“ConnectionId”和“CallId”的帮助下,我们将语音响应作为流输出发送。 您所描述的 Stream 工作但 Gather 不工作的行为是您正在使用的 Twiml 的设计所致。 Twilio 按顺序处理 Twiml,直到“动词”完成后才继续处理。 Twiml 中的动词是“连接”和“聚集”。直播后您可以看到 Gather twiml: <?xml version="1.0" encoding="UTF-8"?> <Response> <Connect> <Stream url="wss://..."/> </Connect> <Gather speechTimeout="auto" speechModel="phone_call" enhanced="true" input="speech" action="/respond"/> </Response> 另一种方法是仅使用 Gather Twiml,然后使用 Twilio REST API 来处理 Media Streams: string accountSid = Environment.GetEnvironmentVariable("TWILIO_ACCOUNT_SID"); string authToken = Environment.GetEnvironmentVariable("TWILIO_AUTH_TOKEN"); TwilioClient.Init(accountSid, authToken); var stream = StreamResource.Create( url: new Uri("wss://example.com/"), pathCallSid: "CAXXXXXXXXXXXXXXXXXXXXXXXXXXX" ); 您的应用程序需要从处于“收集”模式的调用中获取 pathCallSid,然后使用 Twilio REST API 启动该调用的媒体流。这种方法的一个问题是,Gather 似乎最适合通话的一小部分。 解决您提出的另一个问题: 完全通过流来完成吗? 我在获取 StreamId、ConnectionId、CallId 时遇到问题 一个地方。 创建流时查看状态回调参数: statusCallback 属性采用绝对或相对 URL 作为 价值。每当流启动或停止时,Twilio 都会生成一个 请求此网址 例如: <Stream url="wss://..." statusCallback="http://yourapi.com..." /> 发送到 statusCallback url 的参数包含 StreamSid 和 CallSid。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.