blas 相关问题

基本线性代数子程序是用于科学计算中常用的低级矢量和矩阵运算的标准接口集。

为什么 numpy 的 libopenblas 这么大?

我们正在部署一个基于numpy的开源应用程序,其中包括libopenblas.{cryptic string}.gfortran-win32.dll。它是 Python numpy 包的一部分。该 dll 大小超过 27MB。我是

回答 1 投票 0

zgemv 与 dgemv/sgemv 的算术强度?

sgemv(或dgemv)的算术强度是在这组练习中推导出来的(https://florian.world/wp-content/uploads/FM-High-Performance-Computing-I-Assignment-1.pdf)成为: 0.5 / (1+c),其中...

回答 1 投票 0

使用emscripten编译OpenBLAS

我正在尝试为 WebAssembly 编译 OpenBLAS。 我有一个 wasm/matrix.c 文件和从 github 下载的 OpenBLAS-0.3.26-x64-64 文件夹。 // wasm/matMul.c #include“../OpenBLAS/include/cb...

回答 1 投票 0

如何强制Julia使用多线程进行矩阵乘法?

我想求一个相对较小的矩阵的幂,但这个矩阵由 Rational{BigInt} 类型的有理数组成。默认情况下,Julia 仅使用单个线程进行此类计算。我...

回答 1 投票 0

在 Xcode 中,如何为独立模块(框架)设置编译器标志?

我正在编写自己的独立模块,并希望使用 cblas_dasum 来有效计算双精度数组的绝对值之和。虽然弹出一条消息说我必须 指定

回答 1 投票 0

如何正确链接mkl接口与fortls

在我的项目中,我在 mkl 实现下大量使用 blas 子例程,感谢 Intel Advisor,我在编译项目时没有出现任何问题,但我无法识别...

回答 1 投票 0

带有 Sparse BLAS 的 Fortran 不会刷新内存

我有一个构建稀疏矩阵的子例程,我需要调用它几次。然而,似乎如果我多次调用这个子例程(和/或如果稀疏矩阵非常大),

回答 1 投票 0

使用 CMake 检测 BLAS/LAPACK 供应商

所以我的代码希望在不同的 BLAS/LAPACK 供应商发生时包含不同的头文件。是否有任何预定义的宏或类似的东西让我检查它?

回答 2 投票 0

为什么 blas gemm 函数系列中不允许非正向步幅?

sgemm 的 netlib 文档指出,数组步幅 LDA 和 LDB 必须 >= 1,并且足够大,以便列不会重叠。事实上,Apple 的 Accelerate/veclib 中的实现

回答 2 投票 0

如何让 np.multiply 使用多个核心?

标题已经说了。我目前正在并行化我的代码,主要瓶颈是由两个三维 ndarray 的元素乘法造成的。我的系统监视器显示只有...

回答 2 投票 0

如何从C调用CLAPACK?

我正在尝试从 C 调用 CLAPACK 函数。我下载了 CLAPACK-3.2.1(来自 http://www.netlib.org/clapack/clapack.tgz)并按照此处的说明进行操作(http://people.tgz)。 sc.fsu.edu/~%20jburkardt/c_src/

回答 2 投票 0

在 docker 容器内运行 llama-cpp-python 时没有 GPU 支持

我正在尝试按照安装文档但在 docker 容器内运行 llama cpp 的 llama 索引。 按照此存储库安装 llama_cpp_python==0.2.6。 Dockerfile # 使用

回答 1 投票 0

NumPy 内部如何处理非连续切片的矩阵乘法?

您好 Stack Overflow 社区, 我正在使用 NumPy 进行矩阵运算,我有一个关于 NumPy 如何处理矩阵乘法的问题,特别是在处理非连续 sli 时...

回答 1 投票 0

在 EMR 上使用 OpenBLAS Spark

尝试在 EMR 实例上运行 Spark 2.1.0 中的 MlLib ALS 算法时,我不断收到臭名昭著的警告: 警告 BLAS:无法从以下位置加载实现:com.github.fommil.netlib.NativeSyst...

回答 2 投票 0

Spark netlib-java BLAS

我正在尝试对无法正常工作的 apache Spark 和 netlib 设置进行故障排除,但我不知道下一步该怎么做。 这里有一些信息: Spark 1.3.1(但也尝试过1.5.1) 具有 3 个节点的 Mesos 集群 Ubuntu Tru...

回答 2 投票 0

重复单精度复矩阵向量乘法(速度和精度提高)

我将一个长时间运行的函数简化为一系列“简单”的矩阵向量乘法。矩阵没有变化,但是向量却很多。我做了一个测试

回答 1 投票 0

无法使用Meson通过MKL安装Scipy

我正在尝试使用 BLAS 的 MKL 实现安装 scipy 1.9.1,使用 pip 作为我的包管理器。对于 numpy,我可以使用以下命令执行此操作:pip install numpy --no-binary numpy。与 Sci 一起做这件事...

回答 2 投票 0

Accelerate 上单精度浮点数的 snrm2 计算不稳定

我正在尝试使用 snrm2 在 Rust 中执行单精度浮点计算。我链接到 OSX 上的 Accelerate 框架,并使用 blas crate 作为 C 桥。不管随机

回答 1 投票 0

我可以传递与 cblas_gemm(...) 中的“C”和“A”矩阵相同的矩阵指针吗?

我想用值C*B更新C。我还想用值 C*C 更新 C。 这样做安全吗?我不想给我的学生提供糟糕的代码。我目前正在复制临时结果...

回答 3 投票 0

我的 CSR 稀疏矩阵多向量 (SpMM) 乘积函数有什么问题?

我有以下 C 语言稀疏矩阵向量 (SpMV) 乘积代码(假设采用 CSR 存储格式): void dcsrmv(SparseMatrixCSR *A, 双 *x, 双 *y) { for (int i=0; im; i++) ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.