西班牙语神经语音中不自然的停顿

问题描述 投票:0回答:0

西班牙神经声音的叙述方式不同,并且会出现以前没有的停顿。 据我了解,TTS 的设计目的是通过停顿来剪切超过 300 个音素的句子,一个月前这对于 Jorge Mexico 的声音来说效果很好,但在使用 300 个音素的句子几周后,它在 170 个音素周围产生了不必要的停顿,使得旁白听起来不自然。需要注意的是,我从今年年初就开始使用 TTS,以前没有出现过这种情况,但现在大约一个月了,这个问题一直出现。

我使用另一种语音(即 Yago Mexico 的语音)进行了一项不带逗号的长文本测试,该语音有效地削减了大约 300 个音素,而 Jorge Mexico 的语音(我使用的语音)则削减了大约 170 个音素。使用相同的文本。

SSML:https://drive.google.com/file/d/1SeidqYMsSzXnnjyrmFSV_WLicDSuePhK/view?usp=drive_link

我重申,使用相同的文本和其他声音(例如 Yago MX 的声音)不会出现这种不必要的停顿。

azure text-to-speech
© www.soinside.com 2019 - 2024. All rights reserved.