nvcc 相关问题

“nvcc”是NVIDIA基于LLVM的C / C ++编译器,用于使用CUDA定位GPU。

使用nvcc执行OpenMPI代码(OPAL错误)时出错

我试图在NVIDIA Jetson TX2上运行OpenMPI代码。但是当我运行mpiexec时,我得到一个OPAL错误。编译说明:$ nvcc -I / home / user / .openmpi / include / -L / home / user / .openmpi / lib / -...

回答 1 投票 1

nvcc警告设备变量是主变量 - 为什么?

我一直在阅读CUDA编程指南中有关模板功能的内容,这样的工作是什么? #包括 / * host struct * / template struct Test {...

回答 2 投票 1

cudamat在ubuntu上安装nvcc失败

我在EC2上运行了GPU实例,我正在尝试安装cudamat。我已将副本下载到我的主目录:git clone https://github.com/cudamat/cudamat然后我进入该目录...

回答 3 投票 1

Cuda NVCC编译器 - 如何/ showincludes?

我需要在Visual Studio的“输出”窗口中显示所有包含(按照它们包含的顺序),以找出哪个文件产生了一些模糊的错误。但找不到启用“/ ...的方法

回答 2 投票 0

编译.cu vs .cpp:编译器错误,即使没有任何CUDA代码

我编译以下代码:#include #包括 int main(){std :: cout <<“Hello,world!\ n”;通过$ nvcc --version nvcc:NVIDIA(R)Cuda ......

回答 1 投票 0

如何禁用或删除python项目中的numba和cuda?

我只使用点云作为输入克隆了一个“PointPillars”回购用于3D检测。但是当我来运行时,我注意到它使用了cuda和numba。有了这两个先前的知识,我问是否......

回答 1 投票 -2

Cuda - nvcc - 没有内核映像可在设备上执行。问题是什么?

我试图用最简单的例子使用nvcc,但它无法正常工作。我正在编译并执行https://devblogs.nvidia.com/easy-introduction-cuda-c-and-c/中的示例,但是我...

回答 2 投票 1

安装pytorch-gpu时,nvcc和clang不能很好地协同工作

我正在尝试按照官方说明在我的MacBook Pro上安装带有gpu支持的pytorch。事情顺利进行,直到发生错误:[70%]构建NVCC(设备)对象caffe2 / CMakeFiles / ...

回答 1 投票 0

CUDA C ++中的友元函数

我正在研究在命名空间test0中声明类A和B以及在命名空间test1中声明的类A的友元函数f的问题。函数f接收B类对象的引用作为...

回答 2 投票 1

在CUDA上使用RSA加密进行斗争

我正在尝试使用CUDA使用RSA算法加速加密。我无法在内核函数中正确执行power-modulo。我在AWS上使用Cuda编译工具,版本9.0,V9.0.176 ......

回答 1 投票 0

在ubuntu上使用theano导入sidekit时出错

我安装使用conda,终端给我一个关于GPU的错误,但我没有使用GPU。 >>>导入theano >>>导入numpy >>>导入matplotlib >>> ...

回答 1 投票 -1

使用cudaMallocManaged时,为什么NVIDIA Pascal GPU在运行CUDA内核时会变慢

我正在测试新的CUDA 8以及Pascal Titan X GPU,并期待我的代码加速,但由于某种原因它最终会变慢。我在Ubuntu 16.04上。这是最小的代码......

回答 3 投票 10

如何解释ptx函数名称

当我编译我的cuda文件时:nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v,-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...

回答 1 投票 1

NVCC unistd.h(792):错误:预期标识符

NVCC正在返回一个错误,但几乎没有信息可以继续。在转向所谓的“现代cmake”之前,该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...

回答 1 投票 0

在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么?

我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解,当使用NVCC的-gencode选项时,“arch”是最小的计算...

回答 2 投票 30

cuda nvcc使__device__有条件

我正在尝试将cuda后端添加到20k loc c ++表达式模板库中。到目前为止,它工作得很好,但我完全被淹没了“警告:从__host__调用__host__函数...

回答 3 投票 1

编译时的CUDA设备属性和计算能力

假设我有一个代码,允许用户通过threads_per_block来调用内核。然后我想检查输入是否有效(例如<= 512表示计算能力CC <2.0和1024表示...

回答 1 投票 0

命令在当前机器中获取sm版本的gpu

是否有命令在给定的机器中获取gpu的sm版本。这是我的用例:我在多台机器上构建并运行相同的cuda内核。所以我想知道是否有一个可以......的命令

回答 1 投票 1

NVCC -arch -code

我对NVCC文档感到困惑:3.2.7。指导GPU代码生成的选项nvcc -arch = compute_50 -code = sm_50,compute_50(相当于nvcc -arch = sm_50)之间的区别是什么...

回答 1 投票 0

CUDA构建共享库

我需要为cuda创建一个共享库。该库的编译工作正常,但当我尝试在我的程序中使用它时,nvcc返回一个链接器或ptxas错误。我把问题减少到......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.