基于多人语料库的语音合成

Question

作为项目的一部分，我们希望用合成语音进行实验，其中这些语音没有单一的地理起源，身体，年龄或性别。我们有自己的数据集，但我想在VCTK的初始实验中使用Tacotron2或类似的东西建立声音。有谁知道是否已经完成了类似的项目？我们想象的与声音相关的身体是故意模糊的。或者其他TTS在多人语料库中接受过培训的项目？此外，有没有人知道这种方法的任何警告或潜在问题？也许有可能采用可能有益的转移学习方法。

谢谢！

Answer 1

你可以检查https://github.com/r9y9/deepvoice3_pytorch

Multispeaker样品是available以及您可以尝试的预训练模型。

基于多人语料库的语音合成

问题描述投票：0回答：1

1个回答

最新问题

基于多人语料库的语音合成

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1