我一直在玩 sox 并使用
trim
命令,将整个音频分成 n 个部分(每个部分有固定的长度)应该相当简单。
但是,当我打算分割语音录音时,可能会发生简单的分割会在单词中间分割的情况。
有没有办法防止这种情况并确保各部分包含“完整单词”?
查看(已存档)sox 网页上的 soxsilence 命令以获取手册和 sourceforge 上的 Sound eXchange。
sox original.wav new.wav silence 1 0.5 2% 1 2.0 2% : newfile : restart
original.wav - 待拼接的音频文件。
new.wav - 将是新音频文件的名称,每个切片都会附加数字(new1.wav、new2.wav、new3.wav...)。
silence - 效果名称。
1 0.5 2% - 上述周期、持续时间、阈值。
1 2.0 2% - 低于周期、持续时间、阈值。