使用神经网络中使用softmax函数的反向传播算法

问题描述 投票:0回答:1

我正在从头开始为MNIST数据创建一个神经网络,所以我在输出层有10个类。我需要执行反向传播,为此,我需要为最后一层计算dA*dZ,其中dA是损耗函数L的导数,其中softmax激活函数AdZ是softmax激活函数A写入z,其中z=wx+b。对于dA获得的尺寸为10*1,而对于dZ获得的尺寸为10*10

正确吗?如果是,我将dA*dZ乘以谁,因为它们的维数不同。

python python-3.x math neural-network backpropagation
1个回答
0
投票

您快到了。但是,您需要转置dA,例如用numpy.transpose(dA)。然后,您将拥有dAdZ的正确尺寸以执行矩阵乘法。

© www.soinside.com 2019 - 2024. All rights reserved.