Python简单的反向传播不能按预期工作

Question

我正在尝试实现反向传播算法，以显示如何使用双层神经网络来表现为XOR逻辑门。我按照本教程here。

运行后，我希望输出遵循XOR逻辑真值表：

[[0]
 [1]
 [1]
 [0]]

但是我得到：

output after training:  [[0.5]
 [0.5]
 [0.5]
 [0.5]]

关于我可能做错的任何建议？谢谢

完整代码：

import numpy as np


# Sigmoid function
def sigmoid(x, deriv=False):
    if deriv:
        return x*(1-x)
    return 1/(1+np.exp(-x))


# Input dataset
X = np.array([[0, 0],
              [0, 1],
              [1, 0],
              [1, 1]])

# Output dataset
y = np.array([[0, 1, 1, 0]]).T

# seed random numbers to make calculation deterministic
np.random.seed(1)

# initialise weights randomly with mean 0
syn0 = 2*np.random.random((2, 1)) - 1

for iter in range(10000):

    # forward prop
    layer0 = X
    layer1 = sigmoid(np.dot(layer0, syn0))

    layer1_error = y - layer1

    layer1_delta = layer1_error * sigmoid(layer1, True)

    syn0 += np.dot(layer0.T, layer1_delta)
    print(iter)

print("output after training: ", layer1)

Answer 1

你没有做错任何事 - 你已经正确地证明单层ANN不能执行non-linear separation！

XOR输入是不可线性分离的数据示例 - 简单地说，如果在x-y网格上绘制它们，则无法绘制直线以将“0”输出与“1”输出分开。单层人工神经网络只能执行线性分离，因此无论您如何训练它都将无法产生正确的输出。

要解决XOR问题，您需要添加一个额外的图层。看起来你已经有两层（输入层和输出层），但它实际上是单层网络，因为只有一层权重（syn0）。添加第二层（按照您提供的参考中的示例），查看培训结果是否有所改善。

Python简单的反向传播不能按预期工作

问题描述投票：1回答：1

1个回答

最新问题

Python简单的反向传播不能按预期工作

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1