matrix-multiplication 相关问题

与矩阵乘法有关的问题,尤其是实现。数学问题应该考虑线性代数标签。

Matmul输入和权重矩阵的顺序?

[我看到许多ML教程通过构造权重矩阵和输入(或激活)矩阵这两个矩阵并执行矩阵与矩阵相乘(matmul)来形成......>

回答 1 投票 0

cuda.jit矩阵乘法崩溃

我正在尝试将cuda.jit矩阵乘法写成我的线程块数量的上限,它只能是一个。而且我也知道我的乘法是X * Xtranspose的形式。 def ...

回答 1 投票 0

Eigen:我应该使用对齐图进行密集计算吗?

我想对外部分配的数据执行很多计算,尤其是矩阵乘法。可以通过Eigen :: Map完成。不幸的是,我不是向量化计算的专家,...

回答 1 投票 1

为什么dgemm(Cython编译)比numpy.dot慢

长话短说,我在Cython中构建了一个简单的乘法函数,调用scipy.linalg.cython_blas.dgemm,对其进行编译并针对基准Numpy.dot运行它。我听过关于...

回答 1 投票 1

如何使用SSE / AVX指令有效地将2 x 2个64位整数矩阵相乘?

[有没有一种方法可以使用SSE或AVX乘以2 x 2矩阵的无符号64位整数,这比仅不使用任何SSE / AVX指令效率更高?

回答 2 投票 0

3,4轴火炬的矩阵乘法

我有两个张量分别为a(16,8,8,64)和b(64,64)的张量。假设我将ain的最后一个维度提取到另一个列向量c中,我想计算matmul(matmul(c.T,b),c)。我希望在每个...

回答 1 投票 2

用于矩阵矩阵乘法的numpy.dot(),@和方法.dot()之间有什么区别?

有什么区别吗?如果不是,按惯例首选什么?性能似乎几乎相同。 a = np.random.rand(1000,1000)b = np.random.rand(1000,1000)%timeit a.dot(b)#14.3 ms±...

回答 2 投票 1

快速矩阵矢量乘积(MVM)(如果矩阵元素是即时计算的)>

我目前正在一个项目中,必须使用Lanczos-Algorithm计算极值特征值。我替换了MVM,以便即时计算矩阵元素,因为I ...

回答 1 投票 1

由于大量的Numpy点调用而使开销最小化

我的问题如下,我有一个迭代算法,因此在每次迭代时,都需要对i = 1 ... k执行几个矩阵矩阵乘法dot(A_i,B_i)。由于这些...

回答 2 投票 1

Pandas数据框:两列相乘

我正在尝试在数据帧(OPR)中将两列(ActualSalary * FTE)相乘以创建新列(FTESalary),但是不知何故它在第21357行停止了,我不明白是哪里出了问题或...

回答 3 投票 5

“ TypeError:'numpy.ndarray'对象不可调用”-numpy错误

这是我的代码。 def h(x,theta):#这是概率/假设返回np.dot(x,theta)def cost(x,y,theta):#这是成本函数m = x.shape [...

回答 1 投票 0

将不同维度的大矩阵与numpy相乘

我编写了一个python程序,该程序从文本文件中获取数字并生成两个矩阵。这些矩阵的大小非常大。例如,矩阵1为5 * X,矩阵2为X * 5 ...

回答 1 投票 -1

将不同维度的大矩阵与numpy相乘

我编写了一个python程序,该程序从文本文件中获取数字并生成两个矩阵。这些矩阵的大小非常大。例如,矩阵1为5 * X,矩阵2为X * 5 ...

回答 1 投票 -1

np.solve(),但当A(第一个矩阵)未知时

np.solve()当您具有Ax = b形式的方程时效果很好,我的问题是我实际上具有xC = D形式的方程,其中x是我想找出的2x2矩阵, C和D是...

回答 1 投票 1

如何在python的csv中导入3D表?

我必须导入3维数据表才能在我的python脚本中对其进行操作。我拥有的3个维度是:保险年龄保险费保险行和年龄列不固定,...

回答 1 投票 0

“使用goroutine和通道的“矩阵乘法”

我有一个大学项目,当我使用1个goroutine,2个goroutine,3个等等时,测试矩阵乘法的时间差。我必须使用频道。我的问题是走多少都无所谓...

回答 2 投票 -1

如何用浮点数求矩阵乘法的精度

我正在尝试分析当数据大小减小时浮点计算如何变得更加不准确。为此,我想对...

回答 1 投票 1

OpenMP并行乘法比顺序乘法慢

我正在学习OpenMP,我正在尝试做一个简单的任务:A [r] [c] * X [c] = B [r](矩阵向量乘法)。问题是:顺序代码比并行代码快,我也不知道为什么!我的代码:...

回答 1 投票 -1

如何进一步优化矩阵乘法的性能?

我正在尝试优化在单核上运行的矩阵乘法代码。我如何进一步改善循环展开FMA / SSE的性能?我也很好奇为什么......>

回答 2 投票 1

使用AVX的分矩阵乘法

我已经编写了以下C函数,用于使用平铺/分块和AVX向量将两个NxN矩阵相乘以加快计算速度。现在,尽管我尝试时遇到细分错误...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.