大规模并行一维卷积

问题描述 投票:2回答:0

我现在正在使用ArrayFire(OpenCL,而不是cuda),我想知道是否有任何方法可以对一个非常大的(50M + 32位浮点数)向量执行几个并行的一维卷积(以计算移动平均值)。 我已经看到了一些示例,但是在最近的开源版本中,某些较旧的功能无法正常工作。 窗口大小实际上很大(1k-10k)。 FFT方法(卷积的乘积)会比直接卷积更快吗?

c++ opencl fft convolution arrayfire
© www.soinside.com 2019 - 2024. All rights reserved.