blas 相关问题

基本线性代数子程序是用于科学计算中常用的低级矢量和矩阵运算的标准接口集。

为什么 magma_dgemm 函数不使用 V100 GPU 上的张量核心?

我在 V100 和 H100 GPU 上运行 MAGMAtesting_dgemm 代码。通过 Nsight Systems,我发现 V100 上的代码不使用张量核心,但 H100 上的代码则使用张量核心。 V100结果: H100 结果: ...

回答 1 投票 0

BLAS 中矩阵之间的逐元素乘法?

我开始在 C++(特别是 Intel MKL)中使用 BLAS 函数来创建一些旧 Matlab 代码的更快版本。 到目前为止一切顺利,但我不知道如何执行

回答 1 投票 0

DGEMM 与 f2py 的性能

我尝试通过 f2py 将 dgemm 包装在 fortran 中并比较时间。看起来 dgemm 在小维度矩阵中比 numpy-einsum 慢得多(10 倍)。 dgemm 的定时器在 fortra 里面...

回答 0 投票 0

MKL BLAS 不是多线程 zgemv

我在配备两个 AMD EPYC 7443 24 核处理器和 1007GB RAM 的计算机上运行一个非常简单的 MKL BLAS 矩阵-矩阵和矩阵-向量乘法。 代码、编译行和测试结果为

回答 0 投票 0

如何访问 Magma Routine 的结果

我正在尝试使用 magma_sgeev 例程访问一般实矩阵的特征值分解的结果。我的代码如下 - #包括 #包括 #

回答 0 投票 0

使用类型化内存视图和 BLAS 时最大化 Cython 数组操作的速度

我正在尝试最大化我的 Cython 3.0 代码的速度,该代码涉及使用多个数组操作的循环更新数组(包括矩阵向量乘法、向量向量加法和 s...

回答 1 投票 0

linker 找不到共享的 lapack 和 blas,但我正指向它

我正在尝试构建一个 .so 以便在运行时动态链接到 lapack 和 blas。构建时,链接器抱怨找不到 lapack 和 blas,但我正指向它们(我...

回答 1 投票 0

用非零值初始化双数组(BLAS)

我已经分配了一个大的双向量,假设有 100000 个元素。在我的代码中的某个时刻,我想将所有元素设置为一个常量、非零值。如果不使用 for 循环,我怎么能做到这一点...

回答 4 投票 0

在 R 中使用 AMD BLIS / Lapack

伙计们。 我是 AMD Ryzen 5950x 处理器的幸运拥有者。我使用 R 进行不同的计算,所以,早些时候我有一个英特尔处理器,开始使用英特尔 BLAS / Lapack 的最简单解决方案是一个 c ...

回答 0 投票 0

多线程固定大小矩阵向量乘法针对具有非均匀缓存的多核 CPU 进行了优化

我想为固定大小的矩阵(~3500x3500 浮点数)实现并行矩阵向量乘法,该矩阵针对我的 CPU 和缓存布局(AMD Zen 2/4)进行了优化,并为 ch 重复执行...

回答 1 投票 0

英特尔 MKL 多线程矩阵向量乘法 sgemv() 稍作休息后变慢

我需要每 500 微秒运行一次多线程矩阵向量乘法。矩阵是一样的,向量每次都在变化。 我在 64 核 AMD CPU 的 MKL 中使用 Intels sgemv()。如果我

回答 0 投票 0

连接ipopt与openblas

目前,我正在尝试针对openblas构建Ipopt链接。我下载了openblas的源码,并在父目录下做了制作。Ipopt的configure脚本有几个选项链接......

回答 1 投票 0

回答 1 投票 1

使用LAPACK-BLAS DGEMM的矩阵点产品。

使用lapack-blas dgemm函数,我们试图得到这些矩阵的点积 A = Array(Array(0.7266678772119796, 0.37866742996700287, 0.011693659632231124), Array(0.09987886438245919, 0......)

回答 1 投票 3

使用MKL BLAS时,scipy是否支持多线程进行稀疏矩阵乘法?

根据MKL BLAS文档“对于稠密和稀疏BLAS,所有矩阵矩阵操作(级别3)都是线程化的。” http://software.intel.com/zh-CN/articles/parallelism-in-the-intel-math-kernel -...

回答 1 投票 6

Scipy,Blas或Lapack中仅计算上三角矩阵的函数

我的目标是在Python中将矩阵转换为上三角形式。我知道函数scipy.linalg.lu将执行LU分解并计算上下三角形。我需要重复...

回答 1 投票 1

如何在Ubuntu / Lubuntu 20.04中安装libgfortran3?

我正在使用jBlas,它需要libgfortran3并告诉我从以下位置安装它:sudo apt-get install libgfortran3但是我正在使用Lubuntu 20.04,它使用与Ubuntu 20.04相同的软件包。我找不到...

回答 1 投票 1

在C ++中使用库“ xtensor-blas”时出错

我一直在尝试使用xtensor-blas库,但是没有运气。我正在使用Windows,G ++ 8.1.0和MinGW-W64。这是我尝试的一个简单示例:#include #...

回答 1 投票 1

在Python中调用Pardiso 6

我正在尝试在Python中使用Pardiso 6稀疏求解器库。问题是我似乎无法加载Pardiso共享库(SO)。这是调用import ctypes pardiso = ...

回答 2 投票 1

CMake在macOS上找不到LAPACK sgemm

[我正在尝试编译此代码,但是在build文件夹中运行cmake ..时,出现以下消息:-寻找Fortran sgemm-寻找Fortran sgemm-未找到-寻找pthread.h- ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.