为什么我的稳态输出与 Coursera 的解决方案不同?

问题描述 投票:0回答:1

我正在 Coursera 上学习计算神经科学课程,但遇到了其中一个测验问题。

问题的框架如下:

假设我们有一个包含 5 个输入节点和 5 个输出节点的线性循环网络。假设我们网络的权重矩阵 W 是:

W = [0.6 0.1 0.1 0.1 0.1]
    [0.1 0.6 0.1 0.1 0.1]
    [0.1 0.1 0.6 0.1 0.1]
    [0.1 0.1 0.1 0.6 0.1]
    [0.1 0.1 0.1 0.1 0.6]

(基本上都是 0.1,除了对角线上的 0.6。)

假设我们有一个静态输入向量u:

u = [0.6]
    [0.5]
    [0.6]
    [0.2]
    [0.1]

最后,假设我们有一个循环权重矩阵 M:

M = [-0.25, 0, 0.25, 0.25, 0]
    [0, -0.25, 0, 0.25, 0.25]
    [0.25, 0, -0.25, 0, 0.25]
    [0.25, 0.25, 0, -0.25, 0]
    [0, 0.25, 0.25, 0, -0.25]

以下哪项是网络的稳态输出v_ss? (提示:请参阅有关循环网络的讲座,并考虑编写一些 Octave 或 Matlab 代码来处理特征向量/值(您可以使用“eig”函数))'

课程笔记可以在这里找到。具体来说,稳态公式的方程可以在幻灯片 5 和 6 中找到。

我有以下代码:

import numpy as np

# Construct W, the network weight matrix
W = np.ones((5,5))
W = W / 10.
np.fill_diagonal(W, 0.6)
# Construct u, the static input vector
u = np.zeros(5)
u[0] = 0.6
u[1] = 0.5
u[2] = 0.6
u[3] = 0.2
u[4] = 0.1
# Connstruct M, the recurrent weight matrix
M = np.zeros((5,5))
np.fill_diagonal(M, -0.25)
for i in range(3):
    M[2+i][i] = 0.25
    M[i][2+i] = 0.25
for i in range(2):
    M[3+i][i] = 0.25
    M[i][3+i] = 0.25

# We need to matrix multiply W and u together to get h
# NOTE: cannot use W * u, that's going to do a scalar multiply
# it's element wise otherwise
h = W.dot(u)
print 'This is h' 
print h

# Ok then the big deal is:
#                               h dot e_i
# v_ss = sum_(over all eigens) ------------ e_i
#                               1 - lambda_i

eigs = np.linalg.eig(M)

eigenvalues = eigs[0]
eigenvectors = eigs[1]

v_ss = np.zeros(5)
for i in range(5):
    v_ss += (np.dot(h,eigenvectors[:, i]))/((1.0-eigenvalues[i])) * eigenvectors[:,i]
print 'This is our steady state v_ss'
print v_ss

正确答案是:

[0.616, 0.540, 0.609, 0.471, 0.430]

这就是我得到的:

This is our steady state v_ss
[ 0.64362264  0.5606784   0.56007018  0.50057043  0.40172501]

为什么我的输出不同,如何解决?

python matrix linear-algebra algebra
1个回答
1
投票

我用我的矩阵尝试了你的解决方案:

W = np.array([[0.6 , 0.1 , 0.1 , 0.1 , 0.1],
                [0.1 , 0.6 , 0.1 , 0.1 , 0.1],
                [0.1 , 0.1 , 0.6 , 0.1 , 0.1],
                [0.1 , 0.1 , 0.1 , 0.6 , 0.1],
                [0.1 , 0.1 , 0.1 , 0.1 , 0.6]])
u = np.array([.6, .5, .6, .2, .1])

M = np.array([[-0.75 , 0 , 0.75 , 0.75 , 0],
                [0 , -0.75 , 0 , 0.75 , 0.75],
                [0.75 , 0 , -0.75 , 0 , 0.75],
                [0.75 , 0.75 , 0.0 , -0.75 , 0],
                [0 , 0.75 , 0.75 , 0 , -0.75]])

并且您的代码生成了正确的解决方案:

This is h
[ 0.5   0.45  0.5   0.3   0.25]
This is our steady state v_ss
[ 1.663354    1.5762684   1.66344153  1.56488258  1.53205348]

也许问题出在 coursera 上的测试上。您尝试过在论坛上联系他们吗?

© www.soinside.com 2019 - 2024. All rights reserved.