输入
如何创建指纹(简单来说:每组音频信号的平均值)?因为稍后我想将指纹与音频流进行比较以找到相似度百分比。
对于每组音频信号,我对每个信号都进行了 FFT,然后使用阵列对每个频率进行简单的幅度平均。
然后使用实时流,我取 1 秒的数据块,进行 FFT 并与集合的 FTT 平均值进行比较,以找出相似度的百分比。
用平均值做这个,结果不好。
我是这个领域的菜鸟,你能给我一些提示或解决这个问题的过程吗?
非常感谢你。