cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

有没有办法访问CUDA中常量存储体的值

我一直在尝试调试使用内联PTX汇编的cuda程序。具体来说,我正在指令级别进行调试,并尝试确定指令的参数值。

回答 2 投票 0

GPU 上稀疏线性系统的解决方案,来自 nvidia 的论文

我正在阅读一篇关于在 GPU 上求解线性系统(稀疏)的 Nvidia 文章。我陷入了 chainPtrHost 数据结构的构建上。我明白它的作用,但我不明白......

回答 1 投票 0

在CUDA工具包中包含的Thrust库中找不到thrust/universal_vector.h

我目前正在使用 Thrust 在 GPU 和 CPU 之间传输数据。但是当我在代码中包含 并使用 CMake 配置项目时,“致命错误:没有这样的...

回答 1 投票 0

即使设置了 CUDA_HOME 也会出现 CUDA_HOME 错误

我最近尝试运行nvidia labs开发的neuralangelo程序,在设置conda环境时遇到错误: 收集git+https://github.com/NVlabs/tiny-cuda-nn/#

回答 1 投票 0

如何为 CMAKE_<LANG>_HOST_COMPILER 指定标志?

CMake 有一组名为 CMAKE__FLAGS(CMAKE_CXX_FLAGS、CMAKE_Fortran_FLAGS 等)的变量,在构建命令行以使用编译器编译目标时使用这些变量

回答 1 投票 0

PyTorch 和 TensorFlow 中的 GPU ID 命名法

docker 如何为容器分配 GPU? 当我在具有 3 个 GPU 的计算机上运行 3 个 docker 容器时,GPU ID 会改变吗?

回答 1 投票 0

nvcc - 使用 cmake 将标志添加到特定文件

我正在写一个CXX+CUDA项目,我正在使用nvcc进行编译,使用icpc的CXX编译器。 我想为不同的文件添加不同的 icpc 编译标志。在 CXX 独立中这是可能的...

回答 1 投票 0

Eigen::Matrix 中的 cuda::std::complex 导致错误

使用 nvcc eigen_complex.cu -I [eigen 的路径] 编译时,下面的代码会导致以下错误,其中 nvcc 的版本为 12.4,Eigen 的版本为最新版本。有没有办法让我defi...

回答 1 投票 0

如何在linux下安装pip install torch==2.1.2+cu118?

我看到有些人可以安装 pip install torch==2.1.2+cu118 例如: https://github.com/stanfordnlp/dspy/discussions/818 aiohttp==3.9.3 aioprometheus==23.12.0 aiosignal==1.3.1 蒸馏器==1.13.1 注释...

回答 1 投票 0

从 MAT 文件(或类似的其他选项)读取到 CUDA/C

对于一个项目,我需要从该网站检索稀疏矩阵:https://www.cise.ufl.edu/research/sparse/matrices/list_by_id.html 矩阵采用 .MAT 和其他格式的形式,我...

回答 1 投票 0

未找到 nvcc,尽管在路径上

我刚刚使用 nvidia 安装程序在 macOS 上安装了 CUDA 8.0。它安装在 /Developer/NVIDIA.. 因此,我在 PATH 前面加上了 export PATH=/Developer/NVIDIA/CUDA-8.0.61/bin${PATH:+:${P...

回答 2 投票 0

Cuda Mutex,为什么会死锁?

我正在尝试实现一个基于原子的互斥体。 我成功了,但我有一个关于扭曲/死锁的问题。 这段代码运行良好。 布尔阻塞=真; while(被阻止){ if(0 ==atomicCAS(&

回答 1 投票 0

cuda 中的线程/扭曲本地锁

我想在cuda中实现关键部分。我读了很多关于这个主题的问题和答案,答案通常涉及atomicCAS和atomicExch。 然而,这在扭曲级别不起作用,因为......

回答 1 投票 0

对于内核中定义的全局设备指针,从主机到设备的内存复制时 CUDA API 错误 = 0001

我们有一个场景,在内核文件中声明了一个全局设备指针。 我们应该从主机映射该指针并将主机内存指针复制到设备指针。 目前...

回答 1 投票 0

从版本 2.11 开始,Tensorflow 不再使用/查看我的 GPU

更新我的张量流版本后,我无法使用我的 GPU 进行 NN 训练等。即使 CUDA 驱动程序已更新、正确安装,Tensorflow 也没有看到并且没有使用我的 GPU...

回答 2 投票 0

Tensorflow 未使用/查看我的 GPU! (在窗户上)

更新我的张量流版本后,我无法使用我的 GPU 进行 NN 训练等。即使 CUDA 驱动程序已更新、正确安装,Tensorflow 也没有看到并且没有使用我的 GPU...

回答 2 投票 0

在cuda11.7中拦截cuda内存管理相关API,遇到无效设备上下文(201)错误

我实现了一个拦截库,拦截驱动程序API cuMemAlloc() 和 cuGetProcAddress() 然后转发。然后我将LD_LIBRARY_PATH设置为拦截库的路径......

回答 1 投票 0

tensorflow 在 ubuntu 22.04 上的 conda 环境中未检测到 GPU

Ubuntu:22.04 RTX 3070ti 笔记本 + i7 12700 康达24.1.2 张量流2.16.1 驱动程序版本:535.161.07 CUDA 版本:12.2 构建 cuda_11.5.r11.5/compiler.30672275_0 我尝试过 pip install tensorflow...

回答 1 投票 0

如何将cuda运行时函数分配给函数指针

假设我有以下代码 #包括 __device__ int d_run; __global__ 无效内核() { d_运行 = 1 } int main() { 内核<<<1, 1>>>(); 内部运行; 是...

回答 1 投票 0

CUDA 内核 - 嵌套 for 循环

你好 我正在尝试编写 CUDA 内核来执行以下代码段。 对于 (n = 0;n < (total-1); n++) { a = values[n]; for ( i = n+1; i < total ; i++) { b = values[i] -...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.