收到声音时确定样品编号或点

问题描述 投票:0回答:1

我有一个包含录制的啁啾声的wav文件。

频率采样44100通道数1完整采样N 90405秒2.05啁啾声只有50ms。

唧唧的形象:[https://i.imgur.com/Hr4u5tx.jpg][1]

到目前为止我的代码是读取wav文件并执行一些基本处理。

fs_rate, signal = wavfile.read("chirp.wav")
print ("Frequency sampling", fs_rate)
l_audio = len(signal.shape)
print ("Channels", l_audio)
if l_audio == 2:
    signal = signal.sum(axis=1) / 2
N = signal.shape[0]
print ("Complete Samplings N", N)
secs = N / float(fs_rate)
print ("secs", secs)
Ts = 1.0/fs_rate # sampling interval in time
print ("Timestep between samples Ts", Ts)
t = scipy.arange(0, secs, Ts) # time vector as scipy arange field / numpy.ndarray
FFT = abs(scipy.fft(signal))
FFT_side = FFT[range(N//2)] # one side FFT range
freqs = scipy.fftpack.fftfreq(signal.size, t[1]-t[0])
fft_freqs = np.array(freqs)
freqs_side = freqs[range(N//2)] # one side frequency range
fft_freqs_side = np.array(freqs_side)
plt.subplot(311)
p1 = plt.plot(t, signal, "g") # plotting the signal
plt.xlabel('Time')
plt.ylabel('Amplitude')
plt.savefig('chirp.jpg')

问题:使用python如何判断音频文件中啁啾的第一个采样点的位置。收到唧唧声时的第一点。

信号包含背景噪音。我期待的结果应该说这是你的啁啾信号从它开始的频率为2kHz。

PS:这不是作业问题。我正在学习DSP。一种自学。

python python-3.x audio processing signal-processing
1个回答
1
投票

如果您知道啁啾序列,则可以将其与流相关联以启动啁啾。

import scipy.signal as sig
h = sp.array(chirp_sequence)
rxy = sig.correlate(signal, h)
start_idx = arg.max(abs(rxy))
© www.soinside.com 2019 - 2024. All rights reserved.