cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

从 MAT 文件(或类似的其他选项)读取到 CUDA/C

对于一个项目,我需要从该网站检索稀疏矩阵:https://www.cise.ufl.edu/research/sparse/matrices/list_by_id.html 矩阵采用 .MAT 和其他格式的形式,我...

回答 1 投票 0

未找到 nvcc,尽管在路径上

我刚刚使用 nvidia 安装程序在 macOS 上安装了 CUDA 8.0。它安装在 /Developer/NVIDIA.. 因此,我在 PATH 前面加上了 export PATH=/Developer/NVIDIA/CUDA-8.0.61/bin${PATH:+:${P...

回答 2 投票 0

Cuda Mutex,为什么会死锁?

我正在尝试实现一个基于原子的互斥体。 我成功了,但我有一个关于扭曲/死锁的问题。 这段代码运行良好。 布尔阻塞=真; while(被阻止){ if(0 ==atomicCAS(&

回答 1 投票 0

cuda 中的线程/扭曲本地锁

我想在cuda中实现关键部分。我读了很多关于这个主题的问题和答案,答案通常涉及atomicCAS和atomicExch。 然而,这在扭曲级别不起作用,因为......

回答 1 投票 0

对于内核中定义的全局设备指针,从主机到设备的内存复制时 CUDA API 错误 = 0001

我们有一个场景,在内核文件中声明了一个全局设备指针。 我们应该从主机映射该指针并将主机内存指针复制到设备指针。 目前...

回答 1 投票 0

从版本 2.11 开始,Tensorflow 不再使用/查看我的 GPU

更新我的张量流版本后,我无法使用我的 GPU 进行 NN 训练等。即使 CUDA 驱动程序已更新、正确安装,Tensorflow 也没有看到并且没有使用我的 GPU...

回答 2 投票 0

Tensorflow 未使用/查看我的 GPU! (在窗户上)

更新我的张量流版本后,我无法使用我的 GPU 进行 NN 训练等。即使 CUDA 驱动程序已更新、正确安装,Tensorflow 也没有看到并且没有使用我的 GPU...

回答 2 投票 0

在cuda11.7中拦截cuda内存管理相关API,遇到无效设备上下文(201)错误

我实现了一个拦截库,拦截驱动程序API cuMemAlloc() 和 cuGetProcAddress() 然后转发。然后我将LD_LIBRARY_PATH设置为拦截库的路径......

回答 1 投票 0

tensorflow 在 ubuntu 22.04 上的 conda 环境中未检测到 GPU

Ubuntu:22.04 RTX 3070ti 笔记本 + i7 12700 康达24.1.2 张量流2.16.1 驱动程序版本:535.161.07 CUDA 版本:12.2 构建 cuda_11.5.r11.5/compiler.30672275_0 我尝试过 pip install tensorflow...

回答 1 投票 0

如何将cuda运行时函数分配给函数指针

假设我有以下代码 #包括 __device__ int d_run; __global__ 无效内核() { d_运行 = 1 } int main() { 内核<<<1, 1>>>(); 内部运行; 是...

回答 1 投票 0

CUDA 内核 - 嵌套 for 循环

你好 我正在尝试编写 CUDA 内核来执行以下代码段。 对于 (n = 0;n < (total-1); n++) { a = values[n]; for ( i = n+1; i < total ; i++) { b = values[i] -...

回答 3 投票 0

如何理解下面的asm?

__global__ void TEST_prog(int *data_in1, int *data_in2, int *data_out) // 使用 IF 函数 { 无符号整型 tid = (blockIdx.x * blockDim.x) + threadIdx.x; data_out[tid] = data_in1[tid] + dat...

回答 1 投票 0

从命令提示符编译 CUDA 时出错

我正在尝试通过命令提示符在Windows 7上编译cuda测试程序, 我是这个命令: nvcc测试.cu 但我得到的只是这个错误: nvcc 致命:在 PATH 中找不到编译器“cl.exe” 什么...

回答 8 投票 0

__device__ CUDA 上的调用堆栈跟踪

我想在 CUDA __device__ 函数中获取调用跟踪,类似于回溯。可以这样做吗?

回答 1 投票 0

在 Cuda 中计算定点逻辑

我是 Cuda 新手,我尝试并行化多个定点操作。 问题是计算固定点的长度可能变化很大,这不是 SIMT 的最佳解决方案。 我试着剪...

回答 1 投票 0

每当我使用 pytorch 运行程序时都会收到此错误

您系统上的 NVIDIA 驱动程序太旧(发现版本 10010)。请通过以下网址下载并安装新版本来更新您的 GPU 驱动程序:http://www.nvidia.com/Download/index.aspx

回答 1 投票 0

GPU 与 CPU 加速比

参考本文,对于一些简单的图像处理任务,例如,只有很小的加速。当调整图像大小时,您可以获得大约 2 倍的最大加速(CPU 程序的总时间与 t...

回答 1 投票 0

Pytorch CUDA 分配的内存将达到 100 GB

我正在尝试从使用 Pytorch 框架运行的 HuggingFace Transformer 模型中进行推断。我有一个 GPU 实例正在运行,当我检查 cuda 内存摘要时,我发现已分配...

回答 1 投票 0

多个线程将 int 值写入全局内存中的同一位置是否会导致最终值仅来自一个线程

例如,如果两个线程需要同时向全局内存中的同一地址写入两个 int 值:int_1 [byte1, byte2, byte3, byte4] 和 int_2 [byte5, byte6, byte7, byte8],则数据会

回答 1 投票 0

使用 torchaudio.transforms.MelSpectrogram 来处理驻留在 GPU 上的张量

我想在 GPU 上使用 torchaudio 计算 MelSpectrogram。为了测试,我编写了以下代码: 从输入 import 可选 进口火炬 导入火炬音频 将 numpy 导入为 np 来自测试。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.