nvcc 相关问题

“nvcc”是NVIDIA基于LLVM的C / C ++编译器,用于使用CUDA定位GPU。

包括GPU库的路径问题

我正在尝试使用 MAGMA (http://icl.cs.utk.edu/magma/) 在 GPU 上执行一些矩阵运算。我能够成功调用 CUDA 内核,并且没有任何问题。但当我...

回答 2 投票 0

安装Tensorflow(构建pip包)

我正在尝试在WSL2上安装tensorflow 2.6.0。我按照指南(https://www.tensorflow.org/install/source?hl=pl)进行操作,然后: bazel构建//tensorflow/tools/pip_package:wheel --repo_env=WHEEL_NAME=

回答 1 投票 0

nvcc - 使用 cmake 将标志添加到特定文件

我正在写一个CXX+CUDA项目,我正在使用nvcc进行编译,使用icpc的CXX编译器。 我想为不同的文件添加不同的 icpc 编译标志。在 CXX 独立中这是可能的...

回答 1 投票 0

Python中使用gpu,nvcc的PATH中包含空格无法正常调用

这是我在 Stack Overflow 上的第一个问题。 我正在使用 spacy 学习文本分析,但使用 GPU 时遇到问题。 -------------------------------------------------- ------------------------------------------...

回答 1 投票 0

未找到 nvcc,尽管在路径上

我刚刚使用 nvidia 安装程序在 macOS 上安装了 CUDA 8.0。它安装在 /Developer/NVIDIA.. 因此,我在 PATH 前面加上了 export PATH=/Developer/NVIDIA/CUDA-8.0.61/bin${PATH:+:${P...

回答 2 投票 0

pycuda:nvcc 编译 kernel.cu 失败

我刚刚安装了pyCuda,当我尝试编译时: 导入 pycuda.autoinit 将 pycuda.driver 导入为 drv 导入numpy 从 pycuda.compiler 导入 SourceModule mod = 源模块(""" __gl...

回答 3 投票 0

有没有办法在nvcc中为设备代码(内核代码)启用`-Wconversion`?

我最近正在学习用CUDA编写前缀和算法。我有一个愚蠢的错误,我将浮点变量分配给失去精度的整数变量: // 第 3 阶段:填充最后一个元素 o

回答 1 投票 0

为什么编译 CUDA C++ 项目时 nvcc 不起作用而 cmake 起作用?

我有一个用 CUDA C++ 编写的代码,我可以使用 CMake、Make 构建这个项目并像往常一样运行它。但是当我尝试使用 nvcc 来调试它时,它会抛出类似的错误 致命错误:ATen/ATen.h:没有这样的...

回答 1 投票 0

NVIDIA CUDA 12.3 CSR 格式稀疏线性代数缺少函数

有谁知道为什么 CUDA 版本 12 的 cuSPARSE 文档引用 cusparseDcsrsv2_analysis 和 cusparseDcsrsv2_solve,但这些函数在其实际的 cuspa 中找不到...

回答 1 投票 0

将 C++ 共享库与 CUDA 链接时出错

编辑: 我能够减少很多问题。只有三个文件,一个 .cpp、一个 .cu 和一个 heather,并且在尝试链接它们时出现与原始消息相同的错误。 示例代码...

回答 1 投票 0

CMake 无法链接用后缀修饰的共享库(如 somelib.so.1)。有什么办法吗?

我正在尝试 hip/ROCm,并且正在探索跨平台功能。 同时,在 AMD-gpu 上移植 CUDA 实现的受欢迎程度给我留下了深刻的印象。我正经历着一段困难时期...

回答 1 投票 0

使用 NVCC 编译器通过 main.cu 编译 cpp 辅助函数

我在创建 Makefile 将我的主文件编译为 .cu 文件并将我的辅助函数编译为 cpp 文件时遇到问题。我使用 cpp 的原因是辅助函数“sequence.cpp”是

回答 1 投票 0

带和不带-lineinfo标志时内核的寄存器使用计数不同

我有一个在 CUDA 上运行的简单矩阵乘法内核。 使用 -lineinfo 命令和 --ptxas-options -v 进行编译时,寄存器计数显示为 28,而没有 -lineinfo

回答 1 投票 0

CMake 和 Cuda 在设备上单独编译类构造函数在链接期间失败

我在通过 CMake 链接设备上的构造函数时遇到问题。仅当在类内调用函数时才会引起麻烦。你有什么主意吗? 我尝试使用 nvcc 手动编译和链接...

回答 1 投票 0

无法在设备代码上分配大小为 2116800 的数组

我有一个带有 3 个双变量的 Color 类和另一个带有 Color 数组的 Image 类。问题是我无法在 GPU 代码上分配大小为 1960*1080 的颜色数组: #包括 //

回答 1 投票 0

clangd 修改系统包含路径

运行 clangd --check=my_file.cu 我得到了以下内容(简化): I[13:05:09.356] 测试源文件 /path/to/my_file.cu 我[13:05:09.362]正在加载编译数据库... 我[13:05:...

回答 1 投票 0

如何将 Cutlass 包含在 CuPy 项目中?

内核 = r""" #包括 外部“C”__global__无效entry0(){ 返回 ; } ”“” 导入 cupy 作为 cp raw_module = cp.RawModul...

回答 1 投票 0

CMake:通过 NVCC 传递编译器标志列表

我正在尝试编译一些 CUDA,并且希望显示编译器警告。相当于: g++ Fish.cpp -Wall -Wextra 除了 NVCC 不理解这些,你必须通过它们: NVCC...

回答 2 投票 0

CUDA 和 MSVC 的编译错误:来自 <atomic> 未定义的标识符

我正在开发一个使用 cl 作为主机编译器的 CUDA 项目(Visual Studio 2019,MSVC v14.29.30133)。我遇到了与 CUDA 标准库中的 C++11 标头相关的错误

回答 1 投票 0

icpx:错误:生成多个输出文件时无法指定-o

在使用 nvcc 时,我似乎无法向 intel 编译器指定 -xRAPTORLAKE 。 nvcc -ccbin icpx -Xcompiler -xRAPTORLAKE -o exe_文件名源_文件名.cu icpx:错误:基因时无法指定 -o...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.