“nvcc”是NVIDIA基于LLVM的C / C ++编译器,用于使用CUDA定位GPU。
我正在尝试使用 MAGMA (http://icl.cs.utk.edu/magma/) 在 GPU 上执行一些矩阵运算。我能够成功调用 CUDA 内核,并且没有任何问题。但当我...
我正在尝试在WSL2上安装tensorflow 2.6.0。我按照指南(https://www.tensorflow.org/install/source?hl=pl)进行操作,然后: bazel构建//tensorflow/tools/pip_package:wheel --repo_env=WHEEL_NAME=
我正在写一个CXX+CUDA项目,我正在使用nvcc进行编译,使用icpc的CXX编译器。 我想为不同的文件添加不同的 icpc 编译标志。在 CXX 独立中这是可能的...
Python中使用gpu,nvcc的PATH中包含空格无法正常调用
这是我在 Stack Overflow 上的第一个问题。 我正在使用 spacy 学习文本分析,但使用 GPU 时遇到问题。 -------------------------------------------------- ------------------------------------------...
我刚刚使用 nvidia 安装程序在 macOS 上安装了 CUDA 8.0。它安装在 /Developer/NVIDIA.. 因此,我在 PATH 前面加上了 export PATH=/Developer/NVIDIA/CUDA-8.0.61/bin${PATH:+:${P...
我刚刚安装了pyCuda,当我尝试编译时: 导入 pycuda.autoinit 将 pycuda.driver 导入为 drv 导入numpy 从 pycuda.compiler 导入 SourceModule mod = 源模块(""" __gl...
有没有办法在nvcc中为设备代码(内核代码)启用`-Wconversion`?
我最近正在学习用CUDA编写前缀和算法。我有一个愚蠢的错误,我将浮点变量分配给失去精度的整数变量: // 第 3 阶段:填充最后一个元素 o
为什么编译 CUDA C++ 项目时 nvcc 不起作用而 cmake 起作用?
我有一个用 CUDA C++ 编写的代码,我可以使用 CMake、Make 构建这个项目并像往常一样运行它。但是当我尝试使用 nvcc 来调试它时,它会抛出类似的错误 致命错误:ATen/ATen.h:没有这样的...
NVIDIA CUDA 12.3 CSR 格式稀疏线性代数缺少函数
有谁知道为什么 CUDA 版本 12 的 cuSPARSE 文档引用 cusparseDcsrsv2_analysis 和 cusparseDcsrsv2_solve,但这些函数在其实际的 cuspa 中找不到...
编辑: 我能够减少很多问题。只有三个文件,一个 .cpp、一个 .cu 和一个 heather,并且在尝试链接它们时出现与原始消息相同的错误。 示例代码...
CMake 无法链接用后缀修饰的共享库(如 somelib.so.1)。有什么办法吗?
我正在尝试 hip/ROCm,并且正在探索跨平台功能。 同时,在 AMD-gpu 上移植 CUDA 实现的受欢迎程度给我留下了深刻的印象。我正经历着一段困难时期...
使用 NVCC 编译器通过 main.cu 编译 cpp 辅助函数
我在创建 Makefile 将我的主文件编译为 .cu 文件并将我的辅助函数编译为 cpp 文件时遇到问题。我使用 cpp 的原因是辅助函数“sequence.cpp”是
我有一个在 CUDA 上运行的简单矩阵乘法内核。 使用 -lineinfo 命令和 --ptxas-options -v 进行编译时,寄存器计数显示为 28,而没有 -lineinfo
CMake 和 Cuda 在设备上单独编译类构造函数在链接期间失败
我在通过 CMake 链接设备上的构造函数时遇到问题。仅当在类内调用函数时才会引起麻烦。你有什么主意吗? 我尝试使用 nvcc 手动编译和链接...
我有一个带有 3 个双变量的 Color 类和另一个带有 Color 数组的 Image 类。问题是我无法在 GPU 代码上分配大小为 1960*1080 的颜色数组: #包括 //
运行 clangd --check=my_file.cu 我得到了以下内容(简化): I[13:05:09.356] 测试源文件 /path/to/my_file.cu 我[13:05:09.362]正在加载编译数据库... 我[13:05:...
内核 = r""" #包括 外部“C”__global__无效entry0(){ 返回 ; } ”“” 导入 cupy 作为 cp raw_module = cp.RawModul...
我正在尝试编译一些 CUDA,并且希望显示编译器警告。相当于: g++ Fish.cpp -Wall -Wextra 除了 NVCC 不理解这些,你必须通过它们: NVCC...
CUDA 和 MSVC 的编译错误:来自 <atomic> 未定义的标识符
我正在开发一个使用 cl 作为主机编译器的 CUDA 项目(Visual Studio 2019,MSVC v14.29.30133)。我遇到了与 CUDA 标准库中的 C++11 标头相关的错误
在使用 nvcc 时,我似乎无法向 intel 编译器指定 -xRAPTORLAKE 。 nvcc -ccbin icpx -Xcompiler -xRAPTORLAKE -o exe_文件名源_文件名.cu icpx:错误:基因时无法指定 -o...