CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。
如何同步位于同一块但在 cuda c/c++ 中执行不同操作的线程?
我是一名四年级大学生,正在从事并行计算课程项目。我在选择正确的算法来展示 GPU 性能比较方面做出了一个非常错误的决定...
torch.cuda.is_available() 返回 false,我还应该检查什么?
内容: 我在让 PyTorch 识别我的系统上的 CUDA 时遇到问题。详细信息如下: 系统信息: 操作系统:在 WSL2 上运行的 Ubuntu 22.04.4 LTS (x86_64) Python版本:3.7.16 PyTorch
使用 shfl.sync 的 .idx 选项,可以在单个 warp 中的线程之间任意排列寄存器。希望通过使用 shfl.sync,您可以避免存储然后加载数据...
我想我对 CUDA 编程模型和一般编程非常陌生。我正在尝试并行化期望最大化算法。我正在开发具有计算功能的 gtx 480
在 nvcuda.dll 中找不到 cudaDeviceSynchronize()
我正在编写CUDA代码,在VS2022中使用nvcc编译它,生成PTX文件,并从Embarcadero Delphi运行CUDA代码。为了从 Delphi 运行 CUDA 内核,我编写了一个 API
pycuda 找不到内核 cuModuleGetFunction 失败:未找到命名符号
我有以下脚本尝试在图像上绘制矩形 导入CV2 将 numpy 导入为 np 导入 pycuda.autoinit 将 pycuda.driver 导入为 cuda 从 pycuda.compiler 导入 SourceModule 定义
从 std::deque 复制到推力 device_vector
我正在尝试制作一个示例代码,从 std::deque 复制到推力::device_vector,但编译器警告不允许从 __host__ __device__ 函数调用 __host__ 函数(我...
请看这段代码: 无效栏(){} __host__ __device__ 无效 foo() { 酒吧(); } __global__ 无效内核() { foo(); } int main() { 内核<<<1, 1>>>(); gpuErrchk(
每次我想将GPU与Tensorflow(WSL)一起使用时都必须导出CUDNN_PATH
我遇到的问题是,在安装最新版本的 Tensorflow (2.16.1) 时,它没有使用 GPU。 仅在运行以下命令后,它才能识别 GPU(如本中所建议的...
`ptxas 警告:Tensorflow 和 PyTorch 上的寄存器溢出到本地内存
在我们的一项研究中,我们将 Tensorflow 和 Pytorch 与其他主要模型一起使用。每当我们在大学使用数据服务器时,我们都可以在模型训练中使用完整的 GPU。电脑上有一个
作为 GPU 编程(以及某种 CMake)的初学者,我一直在尝试使用 CMake 和 CUDA 制作一个小项目,但我遇到了问题,所以我想知道一种执行以下操作的方法: 好吧,让...
我在jupyter笔记本上使用tensorflow。假设我想刷新 GPU 内存中的所有内容而不重新启动内核(这意味着不触及 RAM 内容)。请不要潜入
在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时出现问题,net.forward();
我在 Visual Studio 中使用 CUDA 编译和运行 OpenCV 项目时遇到问题。我在 Windows 11 中使用 Visual Studio 2022,并使用 CUDA 12.1 和 CUDN 配置了 OpenCV 4.8.0...
几周前,NVIDIA 的 Stephen Jones 进行了一场题为“CUDA:新功能及超越”的 GTC 演讲,其中他介绍了 CUDA v11.7 中即将推出的功能:内核限定符/装饰器
我正在阅读 Nvidia 的幻灯片(优化 CUDA 中的并行缩减),讨论并行缩减算法。 幻灯片 15: 在这里,作者讨论了通过使用顺序寻址,我们
我想使用主板作为主显示适配器,并使用 NVIDIA 显卡作为专用 CUDA 处理器。我的第一个想法是简单地将显示器的 VGA 线插入主板......
我已经使用 cudaMalloc3D 使用 cudaPitchedPtr 创建了一个 3D 矩阵,我也想从设备函数引用创建的矩阵。是否将倾斜指针复制到 __device__
任务类似于如何并行有效地设置位向量的位?,但是对于 CUDA。 考虑其中有 N 位的位向量(N 很大,例如 4G)和 M 个数字的数组(M 也很大,例如...
我的笔记本电脑上有 Nvidia GeForce GTX 1650。它没有启用cuda。我可以将此 GPU 与 TensorFlow 和 pytorch 一起使用吗?除了 CUDA 之外还有什么可以使用的吗? 我尝试安装不同的版本...