一组短音频文件的分类/指纹,以便能够与音频流进行比较

问题描述 投票:0回答:0

输入

  • 10组以上的短音频信号(小于1秒)
  • 每组由20-30多个音频信号组成
  • 实时音频流检查相似度百分比

如何创建指纹(简单来说:每组音频信号的平均值)?因为稍后我想将指纹与音频流进行比较以找到相似度百分比。

对于每组音频信号,我对每个信号都进行了 FFT,然后使用阵列对每个频率进行简单的幅度平均。

然后使用实时流,我取 1 秒的数据块,进行 FFT 并与集合的 FTT 平均值进行比较,以找出相似度的百分比。

用平均值做这个,结果不好。

我是这个领域的菜鸟,你能给我一些提示或解决这个问题的过程吗?

非常感谢你。

python-3.x fft similarity audio-fingerprinting
© www.soinside.com 2019 - 2024. All rights reserved.