[从线性代数我们知道线性算子是可交换的和可关联的。
在深度学习世界中,此概念用于证明在NN层之间引入非线性是合理的,这种现象俗称linear lasagna,(reference)。
在信号处理中,这是优化内存和/或运行时要求(reference)的众所周知的技巧。
因此,从不同的角度来看,合并卷积是一个非常有用的工具。如何使用PyTorch实施?
[如果我们有y = x * a * b
(其中*
表示卷积,而a, b
是您的内核),我们可以定义c = a * b
使得y = x * c = x * a * b
如下: