输出scipy的wavfile.read函数

Question

我尝试使用scipy.io.wavfile.read函数获取音轨的声压，并获得，如文档两个输出中所示：采样率和数据numpy数组。到现在为止还挺好。

我的问题是输出数组是（Nx2）维度，我不知道这两个维度代表什么。我期望获得具有样本总数的（Nx1）维数组。

我已经在网上查找并没有找到任何东西，甚至在将音频信号转换为单声道后，我仍然得到一个Nx2阵列，所以我不认为这些是左右声道（但我可能是错的）。

运行以下代码：

scipy.io.wavfile.read(path+"slow_jazz.wav")

给出以下输出：

(44100, array([[-1.37977577e-06,  8.62224842e-05],
   [ 1.10934685e-04, -1.24923863e-05],
   [ 3.23722816e-05,  6.47113484e-05],
   ...,
   [ 2.37652988e-04,  1.36341288e-04],
   [ 2.67631025e-04,  2.15149150e-04],
   [ 2.91718607e-04,  2.33943792e-04]], dtype=float32))

知道发生了什么事吗？

Answer 1

最后一个维度是通道数。 2表示您有一个立体声wav文件作为输入。

输出scipy的wavfile.read函数

问题描述投票：1回答：1

1个回答

最新问题

输出scipy的wavfile.read函数

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1