音频标准化/固定?

问题描述 投票:-1回答:1

我正在使用一些音频指纹技术来标记长录音中的歌曲。例如,在电台节目中。指纹识别机制工作正常,但我有规范化(或下采样)的问题。

alt text

在这里你可以看到两首相同但不同的波形。我知道我应该做一些DC偏移固定并使用一些高低增益滤波器。我已经通过Sox使用高通1015和低通1015来做它们。我使用wavegain来修正音量和DC偏移。但在这种情况下,波形变为如下所示:

alt text

但即使在这种情况下,我也无法获得相同的指纹。 (我不期望%100相同,但至少%50会很好)

所以。你怎么看?如何修复记录以获得相同的指纹?也许一些音频过滤可以工作,但我不知道使用哪一个?你能帮助我吗?

顺便说一下,这里是指纹识别技术的解释。

http://wiki.musicbrainz.org/Future_Proof_Fingerprint

http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function

audio fingerprint waveform
1个回答
2
投票

您的输入波形似乎是削波,因此任何过滤量都不会产生有意义的“指纹”。确保收集具有合理动态范围但不剪切的有效输入样本。

© www.soinside.com 2019 - 2024. All rights reserved.