cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

除了 CUDA 之外,C++ 中是否允许使用三重尖括号 `<<<` and `>>>`?

nvcc 可以识别此语法,以在 CUDA 内核调用中分配线程和块的数量,但是在 CUDA 之外是否有任何上下文可以使其成为合法的 C++? (任何 C++ 版本,包括草稿...

回答 1 投票 0

PyTorch cuda 内存不足问题

在 PyTorch 中训练模型时,我不断收到以下错误。我什至在代码开头添加了以下内容,但我不断收到此消息。我通过 Jupyter Notebook 运行它。

回答 1 投票 0

为什么 torch.version.cuda 和 deviceQuery 报告不同的版本?

我对我的系统上安装的 CUDA 版本以及我的软件能否有效使用有疑问。 我在网上做了一些研究,但找不到解决我的疑问的方法。 这个问题...

回答 3 投票 0

无法在 GPU 上应用大津阈值,opencv 会抛出以下错误:errorthreshold.cu:105: error: (-215:Assertion failed) type <= 4 in function 'threshold'

我正在尝试在 GPU 中完成所有图像处理而不是 CPU 处理: #编码=utf8 导入CV2 # 阅读 GPU 上的图像 图像 = cv2.cuda_GpuMat() image.upload(cv2.imread("sutil.jpeg&q...

回答 1 投票 0

具有多(CPU)线程的多GPU编程

我有一个令人尴尬的并行应用程序。是否可以启动多个CPU线程,以便一个线程管理一个GPU?如果可以,我应该在CPU端使用什么线程库?

回答 2 投票 0

为什么 CUDA 内核会因 CPU 代码而变慢?

我使用 CUDA 编写了一个屏蔽模板匹配算法。正如我所测试的,该算法的功能是正确的。然而,当我尝试比较该算法的 CUDA 实现时...

回答 1 投票 0

cuda 内核函数中的 for 循环给出错误的值

我有一些带有 2d 内核函数的 cuda 代码,如下所示: #包括 #包括 #包括 #包括 #定义r...

回答 1 投票 0

我可以强制进行某些计算,尽管它们的结果没有在内核中使用吗?

我正在尝试分析我的 CUDA 内核执行的计算的某一部分的“成本”。当然,还有分析的使用。但我想确定的是...

回答 1 投票 0

“cudaMalloc”无意中在多个 GPU 上分配内存,而不是仅 1 个

我在使用 CUDA 的系统上遇到了一个奇怪的问题。最初,我认为问题出在 pytorch 上,但这个自定义 CUDA C 代码仍然存在问题。 #包括 #包括 #

回答 1 投票 0

我收到有关错误的错误:Can't find libdevice directory ${CUDA_DIR}/nvvm/libdevice in tensorflow object_detection api

Windows版本:Windows 10 Pro 21H2 19044.1706 显卡:rtx2070 将张量流导入为 tf 进口火炬 打印(火炬.__版本__)#1.10.1+cu113 打印(火炬.版本.cuda)#11.3 打印(tf.__version__)#2.9.1...

回答 5 投票 0

Pytorch、随机数生成器和设备

我总是在我的 Pytorch 笔记本上放一个像这样的单元格: 设备=( “库达” 如果 torch.cuda.is_available() 否则“议员” 如果 torch.backends.mps.is_available() ...

回答 1 投票 0

PyTorch 安装问题:PyTorch 0.4.1 - Windows 11 上的 CUDA 9.2

我对深度学习的理解有限,所以希望通过PyTorch来学习。我更喜欢从旧版本的 PyTorch 开始。 我在 Windows 11 上下载并安装了 CUDA 9.2,我的 C...

回答 1 投票 0

获取 CUDA Thrust 以使用您选择的 CUDA 流

查看 CUDA Thrust 代码中的内核启动,似乎它们总是使用默认流。我可以让 Thrust 使用我选择的流吗?我是否遗漏了 API 中的某些内容?

回答 3 投票 0

如何调试代码 700“非法内存访问”,又名“CUDA_EXCEPTION_14,Warp 非法地址”?

我的代码正在显示 CUDA 调用“cudaStreamSynchronize(0)”时出错,代码为 700,在 489 上遇到非法内存访问 0# my_func(signed char const*, unsigned char const*, int*, i...

回答 1 投票 0

为了尽可能快的速度,我应该对 CUDA 中的矩阵使用什么步幅?

我正在处理大小范围从 2,000x2,000 到 5,000x5,000 的矩阵,进行乘法和 QR 分解等运算。例如,我很好奇我是否应该调整步幅......

回答 1 投票 0

通过在内核中初始化数据而出现“GPU 页面错误”

我是 CUDA/C++ 新手,正在研究统一内存。我找到了这个主题的介绍。但是,我对其中一个示例有疑问。 为了减轻迁移开销...

回答 1 投票 0

createInferBuild_内部错误

我在VS2022中用c++编写了以下几行代码。 记录器类:公共 ILogger { void log(严重性严重性,const char * msg)noexcept覆盖 { // 抑制我...

回答 1 投票 0

即使 GPU 被识别,Tensorflow 也无法选择 GPU

我尝试设置张量流以与我的GPU(gtx 1070)一起运行。 我安装了最新的 nvidia 驱动程序 546.29-desktop-win10-win11-64bit-international-dch-whql.exe nvidia-sim 的输出 +-------------...

回答 1 投票 0

运行时错误:CUDA 错误:内存不足 - CUDA 内存发生在验证阶段

当我的深度学习模型运行验证时,出现“CUDA 错误:内存不足”问题。虽然之前处于训练阶段、前向和反向传播阶段 - 这应该需要......

回答 1 投票 0

为了获得尽可能快的速度,我应该对 CUDA 中的矩阵使用什么步幅?

我正在处理大小范围从 2,000x2,000 到 5,000x5,000 的矩阵,进行乘法和 QR 分解等运算。例如,我很好奇我是否应该调整步幅......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.