如何用python从一个wav文件中得到频率和时间的数据框?

问题描述 投票:0回答:1

我已经能够使用librosa读取一个波形文件,但能够得到一个频率和振幅的列表,但缺少了最重要的部分 "时间",我不知道如何去一个回合。

import librosa
from matplotlib import pyplot as plt
from librosa import display
import seaborn as sns

sns.set() # Use seaborn's default style to make attractive graphs
plt.rcParams['figure.dpi'] = 100 # Show nicely large images in this notebook

samples, sampling_rate = librosa.load('last.aac')
plt.figure(figsize=(13,4))
librosa.display.waveplot(y = samples, sr =  sampling_rate)

plt.xlabel("Time (Seconds)")
plt.ylabel("Amplitude")
plt.title("Time Domain Frequency")
plt.show()
print("sampling rate is :", sampling_rate)
print("Number of samples :", len(samples))

max1 = max(samples*10)
print("Maximum amplitude", round(max1, 2))

min1 = min(samples*10)
print("Minimum amplitude", round(min1, 2))

import pandas as pd
d=pd.DataFrame(samples,columns=["Amplitudes"], index=None)
d.head()


Amplitudes  frequencies
0.091039    2756.813965
-0.040613   2427.044189
-0.046945   2347.927002
-0.136473   2323.757080
0.050659    2317.414062

我真正想提取的是下面这个

Time Frequency Amplitude
0   0.00000 -57.72730
0  21.53320 -63.55554
0  43.06641 -85.05077
0  64.59961 -91.29989
0  86.13281 -83.86144
0 107.66602 -81.54240
python pandas dataframe speech
1个回答
1
投票

如果你有采样率(以赫兹为单位),你可以用它来创建一个指数,以秒为单位。 这是一个例子,使用4秒的音频文件。

import librosa
import pandas as pd

y,sr = librosa.load('myfile.wav')

df = pd.DataFrame(y, columns=['Amplitude'])

df.index = [(1/sr)*i for i in range(len(df.index))]

print(df.head())
print(df.tail())

输出。

          Amplitude
0.000000  -0.004855
0.000045  -0.007008
0.000091  -0.005919
0.000136  -0.006276
0.000181  -0.005805

          Amplitude
3.999773   0.000892
3.999819   0.000765
3.999864   0.000543
3.999909   0.000428
3.999955   0.000216

现在指数的单位是秒

需要注意的是,你从哪里得到的 Frequencies 列在你的例子中没有显示出来,而且所有的绘图的东西都与问题无关,所以你应该修剪一些,以便在SO上发布问题。

© www.soinside.com 2019 - 2024. All rights reserved.