我有一个单声道wav文件,用于发出“玻璃破碎”的声音。当我使用librosa库在python中以图形方式显示其级别时,它显示了很大的幅度范围,在+ / 20000之间,而不是+/-1。当我使用Audacity打开相同的wav文件时,级别在+/- 1之间。] >
我的问题是什么在显示的幅度水平上产生这种差异,如何在Python中纠正它? MinMax缩放会扭曲声音,如果可能的话,我想避免它。
代码是:
from scipy.io import wavfile fs1, glass_break_data = wavfile.read('test_break_glass_normalized.wav') %matplotlib inline import matplotlib.pyplot as plt import librosa.display sr=44100 x = glass_break_data.astype('float') plt.figure(figsize=(14, 5)) librosa.display.waveplot(x, sr=sr)
这些是笔记本电脑和Audacity的图像:
我有一个单声道wav文件,用于发出“玻璃破碎”的声音。当我使用librosa库在python中以图形方式显示其电平时,它显示了很大的幅度范围,在+ / 20000之间,而不是+/-1。...
WAV通常使用整数值表示单个样本,而不是浮点数。因此,您在librosa
中看到的内容对于16位/样本音频文件是准确的。