为什么Sonic Visualizer和我的Python脚本在频谱分析中存在dB差异？

Question

似乎在实现从音频文件创建频谱的功能时遇到问题。我问这个问题，希望有人能找到问题。

您可以下载32位浮动WAV音频文件here。

我正在研究一个脚本，该脚本使用SciPy和NumPy从音频文件创建频谱分析。在开始之前，我使用Sonic Visualizer分析了文件，得到了以下结果：

现在，我尝试使用Python脚本重现此结果，但得到不同的结果：

除dB值的标度外，一切看起来都不错。在100Hz时，Sonic Visualizer为-40dB，我的脚本为-65dB。因此，我认为我的脚本将FFT结果转换为dBFS时出现问题。

如果我将Sonic Visualizer的曲线与脚本的输出相匹配，则显然级别转换缺少一些因素：

使用上面的'demo.wav'文件，我脚本的最低版本看起来像这样：

from pathlib import Path

import matplotlib.pyplot as plt
import numpy as np
from scipy.io import wavfile as wavfile
from scipy.signal import savgol_filter

def db_fft(data, sample_rate):
    data_length = len(data)
    weighting = np.hanning(data_length)
    data = data * weighting
    values = np.fft.rfft(data)
    frequencies = np.fft.rfftfreq(data_length, d=1. / sample_rate)
    s_mag = np.abs(values) * 2 / np.sum(weighting)
    s_dbfs = 20 * np.log10(s_mag)
    return frequencies, s_dbfs

audio_file = Path('demo.wav')
frequency, data = wavfile.read(str(audio_file))
data = data[0:4096]
x_labels, s_dbfs = db_fft(data, frequency)
flat_data = savgol_filter(s_dbfs, 601, 3)
plt.style.use('seaborn-whitegrid')
plt.figure(dpi=150, figsize=(16, 9))
plt.semilogx(x_labels, s_dbfs, alpha=0.4, color='tab:blue', label='Spectrum')
plt.semilogx(x_labels, flat_data, color='tab:blue', label='Spectrum (with filter)')
plt.grid(True)
plt.title(audio_file.name)
plt.ylim([-160, 0])
plt.xlim([10, 10000])
plt.xlabel('Frequency [Hz]')
plt.ylabel('Amplitude [dB]')
plt.grid(True, which="both")
target_name = audio_file.parent / (audio_file.stem + '.png')
plt.savefig(str(target_name))

[脚本将前4096个样本用作窗口，就像Sonic Visualizer一样，将32位浮点音频文件转换为dBFS频谱图。

我的脚本在哪里，为什么我得到不同的结果？

Answer 1

1。不同的分贝

第一个大区别是，他们使用的是this Wikipedia page中分贝的“功率比”定义：

表示功率比时，分贝数是其以10为底的对数的十倍。

我也在v4.0.1 source code中进行了验证（在svcore/base/AudioLevel.cpp中，第54行）

double dB = 10 * log10(multiplier);

2。不同幅度的计算

它们看起来只是在计算幅度时用代码中的窗口大小除以。这导致计算更改为

s_mag = np.abs(values) * 2  / data_length

3。 “更正”结果

我还没有找到导出其频谱的方法，但是我已经手动读取了前几个值（注意，不是dB值），>]

theirvalues = [ 0.00074, 0.000745865, 0.00119605, 0.0013713, 0.0011812, 0.000746891, 0.000334177, 0.000163241, 7.57671e-5, 3.17983e-5, 2.91934e-5, 3.74938e-5 ]

我提到了两个更改，图形比较如下：

这仍然不是精确匹配，但距离更近。我怀疑可能仍会进行某种平滑处理（代码中引用了蛇麻草，但我不太想知道它们在做什么）。

Answer 2

正如您所指出的，您的两个结果相差一个恒定因子，约为2。

为什么Sonic Visualizer和我的Python脚本在频谱分析中存在dB差异？

问题描述投票：0回答：2

2个回答

1。不同的分贝

2。不同幅度的计算

3。 “更正”结果

最新问题

为什么Sonic Visualizer和我的Python脚本在频谱分析中存在dB差异？

问题描述 投票：0回答：2

2个回答

1。不同的分贝

2。不同幅度的计算

3。 “更正”结果

最新问题

问题描述投票：0回答：2