为什么torch.nn.function.linear中权重的维度是(out,in)而不是(in,out)

问题描述投票：0回答：1

在torch.nn.function.linear的文档中（https://pytorch.org/docs/stable/ generated/torch.nn.function.linear.html），权重输入的维度为（out_features， in_features) 然后在计算输出时对权重矩阵进行转置：y=xA^T+b。他们为什么这样做而不是采用维度矩阵 W（in_features、out_features）并执行 y=xW+b？

通过执行 y=xW+b 尺寸将匹配，因此我找不到上述的明确原因。

machine-learning matrix deep-learning pytorch

1个回答

0
投票

尚不完全清楚他们为什么这样做。很久以前，由于某种原因，它就以这种方式实现了，现在改变它是向后不兼容的。您可以在here找到对此的讨论。转置操作不会增加任何开销，因此没有性能激励来更改它。

最新问题

关于的超链接：空白
保存的图像“无法显示，因为它包含错误”
Winsock connect() 挂在一个网络上，但不在另一个网络上
Python - 通过套接字连接到 Counterstrike 服务器
如何跟踪我在数组中的位置
Char* getter 函数访问堆
替代 SQL Server 2016 之前的 STRING_AGG
无法弄清楚如何使用 python 写入桌面上的记事本文件
如何关闭数据库
Java SQLite3 连接失败
选择带有文本的某些单元格并使用宏隐藏列
使用 Connect/NodeJS 时出现不需要的多个请求
雅虎财务指标和增长率计算
Node.js Connect session() 参数中的安全选项是什么
Unix 服务器客户端连接：连接被拒绝
Node.js 静态文件服务器逻辑（使用 Connect 中间件）
TCP客户端如何连接服务器并发送到服务器端？出现错误并且无法成功运行代码。
connect(localhost) 抛出异常，connect(私有地址) 阻塞
如何将信号从 qconcurrent 线程连接到共享一个字符串的 gui 线程
epoll中connect()失败如何通知？

为什么torch.nn.function.linear中权重的维度是(out,in)而不是(in,out)

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1