cublas 相关问题

NVIDIA CUDA基本线性代数子程序（cuBLAS）库是完整标准BLAS库的GPU加速版本，可与支持CUDA的GPU一起使用。

我对使用 cublasGemmEx API 时 cublasComputeType_t 对计算的影响有点困惑。例如我的A、B、C矩阵都是float类型。当 cublasComputeType_t=

matrix cuda matrix-multiplication cublas

回答 1 投票 0

我想用这个 4x4 协方差矩阵进行 EVD： cuDoubleComplex m_cov_[16] = { make_cuDoubleComplex(2.0301223848037391, 3.4235008150792548e-17), make_cuDoubleComplex(1.

c++ cuda cublas

回答 1 投票 0

CUBLAS 与行主数据的矩阵乘法

我在这里阅读了一些相关的文章，并成功使用 cuBLAS 进行行主矩阵乘法： A*B（列专业）= B*A（行专业）我写了一个包装器来执行此操作，以便我可以传递行

c++ cuda cublas

回答 1 投票 0

比较自定义 cuda 内核、cublas 和 cutensor 之间的性能

我进行了以下 CUDA 测试来比较（方）矩阵乘法的性能数据，在 Ubuntu 24.04 上运行，GPU 卡 Quadro T1000 Mobile 的计算兼容性为 7.5（...

cuda tensor cublas

回答 1 投票 0

特定格式的CUDA cublasSgemm矩阵乘法

我想使用CUDA的cublasSgemm函数将两个矩阵A和B相乘。但是，A 采用行优先格式，B 采用列优先格式，我希望输出采用行优先格式。我...

matrix cuda matrix-multiplication cublas

回答 2 投票 0

错误：找不到满足 nvidia-cublas-cu12==12.1.3.1 要求的版本（来自版本：0.0.1.dev5）

我在 MacOS 芯片 Apple M1 上运行项目时遇到问题。当我安装项目需求文件（pip install -rrequirements.txt）中列出的依赖项时，它会抛出这个错误...

python-3.x pip requirements.txt cublas

回答 1 投票 0

如何修复 llama_cpp_python 的 GPU 错误？

这是我将 n_gpu_layer 设置为 1 时的答案要学习Python，您可以考虑以下选项：在线课程：Coursera、edX、Codecadem 等网站♠♦♥◄！▬$▲▅ ▅☻↑↨►☻层↨ ▼♦$§→↓ ♠♥§ ▬▅↔→...

cublas llama-cpp-python

回答 1 投票 0

如何使用诗歌安装 llama-cpp-python 和 cuBLAS？

我可以使用 pip 安装 llama cpp 和 cuBLAS，如下所示： CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install llama-cpp-python 但是，我不知道如何用 cuBLAS 安装它，当...

python-poetry cublas llama-cpp-python

回答 1 投票 0

我如何知道 koboldcpp 是否正在使用我的 GPU？

我在 Ubuntu 18.04 上使用以下命令从源代码编译了 koboldcpp： git 克隆 https://github.com/LostRuins/koboldcpp cd 狗头人使-j10 koboldcpp_cublas LLAMA_OPENBLAS = 1 LLAMA_CUBLAST = 1 但当它...

nvidia ubuntu-18.04 cublas koboldai

回答 1 投票 0

在 docker 容器内运行 llama-cpp-python 时没有 GPU 支持

我正在尝试按照安装文档但在 docker 容器内运行 llama cpp 的 llama 索引。按照此存储库安装 llama_cpp_python==0.2.6。 Dockerfile # 使用

docker blas cublas llamacpp llama-cpp-python

回答 1 投票 0

编译CUDA示例程序

我有一个非常简单的CUDA程序，但拒绝编译这是main.cpp #包括 #包括 #include“/opt/cuda/targets/x86_64-linux/include/cuda_runtime.h&qu...

c++ cmake cuda linker cublas

回答 1 投票 0

‘/tmp/tmpxft_0000120b_0000000-10_my_program”中对‘cublasCreate_v2’的未定义引用

我尝试在NVIDIA Tesla P100显卡（Ubuntu版本16.04）上使用CUDA 9.0工具包编译代码，代码中使用了CUBLAS库。为了编译，我使用了以下com...

cuda cublas

回答 1 投票 0

CUBLAS 与行主数据的矩阵乘法，无需转置

我目前正在尝试在 GPU 上使用 CUBLAS 实现矩阵乘法。它适用于方阵和某些大小的输入，但对于其他输入，最后一行不会返回（并且

c++ cuda cublas

回答 1 投票 0

cublas 使用 cublas.lib 直接进行 Fortran c 绑定

我正在尝试设置一个接口来在 Fortran 中使用 cublas.lib，而不需要任何单独的 C 代码。我看过一些这样的例子，并尝试复制这些例子，但遇到了麻烦。这两个

cuda fortran cublas

回答 1 投票 0

ValueError：在系统路径中找不到 libcublas.so.*[0-9]

我正在尝试在我的 Django Rest 框架项目中导入和使用 ultralytics 库，我使用诗作为我的依赖管理器，我使用诗添加 ultralytics 安装了 ultralytics 并尝试 IM...

django django-rest-framework cublas

回答 3 投票 0

为什么 magma_dgemm 函数不使用 V100 GPU 上的张量核心？

我在 V100 和 H100 GPU 上运行 MAGMAtesting_dgemm 代码。通过 Nsight Systems，我发现 V100 上的代码不使用张量核心，但 H100 上的代码则使用张量核心。 V100结果： H100 结果： ...

cuda nvidia blas cublas magma

回答 1 投票 0

将 cublasHandle_t 传递给用户函数时出现问题

我正在使用 CUDA 并行化特定的谱聚类算法，并且遇到了一个奇怪的错误。在这个阶段，我仍在测试我打算并行的每一个步骤......

cuda cublas

回答 1 投票 0

子矩阵乘法

我需要进行更多次子矩阵乘法（来自相同的两个矩阵），其中子矩阵的维度和偏移量在每次迭代时都会发生变化。你知道合适的 cublas 函数吗...

cublas

回答 0 投票 0

OSError：未定义符号：cublasLtGetStatusString，版本 libcublasLt.so.11 仅在 tmux 终端中

我在终端中运行一个 shell 脚本，一切正常，但是在进入 tmux 终端，并在相同的 conda 环境中运行相同的脚本后，我得到了这个错误：操作系统错误：/

linux shell tmux cublas

回答 0 投票 0

cublas地址超出特定矩阵大小的范围。

当我运行以下代码来计算矩阵乘法y = X * B。#include #include #include #include "cublas_v2.h" using ...

cuda cublas

回答 1 投票 0

cublas 相关问题

最新问题