基于多人语料库的语音合成

问题描述 投票:0回答:1

作为项目的一部分,我们希望用合成语音进行实验,其中这些语音没有单一的地理起源,身体,年龄或性别。我们有自己的数据集,但我想在VCTK的初始实验中使用Tacotron2或类似的东西建立声音。有谁知道是否已经完成了类似的项目?我们想象的与声音相关的身体是故意模糊的。或者其他TTS在多人语料库中接受过培训的项目?此外,有没有人知道这种方法的任何警告或潜在问题?也许有可能采用可能有益的转移学习方法。

谢谢!

text-to-speech voice
1个回答
0
投票

你可以检查https://github.com/r9y9/deepvoice3_pytorch

Multispeaker样品是available以及您可以尝试的预训练模型。

© www.soinside.com 2019 - 2024. All rights reserved.