我看到许多ML教程通过构造权重矩阵和输入(或激活)矩阵这两个矩阵并执行矩阵与矩阵相乘(矩阵)来形成线性方程,从而解释了完全连通的网络。
我看到的所有示例都将输入作为matmul的第一个参数,并将权重张量作为第二个参数。这是为什么?为什么不能执行权重乘以输入(假设权重矩阵是正确创建的,列数等于输入矩阵的行数)?