cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

CUDA 矩阵乘法中的分段错误(核心转储)

我正在开发用于矩阵乘法的 CUDA 程序,并且遇到“分段错误(核心转储)”错误。我已经包含了下面代码的相关部分。错误发生...

回答 1 投票 0

如何为这个函数编写cuda内核?

我有一个 C 内核,我想将其转换为 cuda 内核。然而,我在为这个函数编写内核时遇到了麻烦,因为它由多个嵌套循环组成。我的方法是

回答 1 投票 0

为什么CUDA无法与easyocr一起使用?

根据Pytorch我在cmd中使用了这个命令 pip3 安装 torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113 但CUDA仍然不可用。有人可以帮助我吗,

回答 3 投票 0

PyCUDA 和 NumbaPro CUDA Python 有什么区别?

我是 CUDA 新手,正在尝试弄清楚 PyCUDA(免费)还是 NumbaPro CUDA Python(非免费)对我来说更好(假设库成本不是问题)。 两者似乎都要求您...

回答 2 投票 0

找不到 CUDA 10.0 的 Pytorch 1.7 兼容版本

我正在重现一个需要pytorch 1.7和CUDA 10.0的项目。 但是,我发现(https://pytorch.org/get-started/previous-versions/)CUDA 10 没有 pytorch 1.7 版本保留...

回答 1 投票 0

CMake:通过 NVCC 传递编译器标志列表

我正在尝试编译一些 CUDA,并且希望显示编译器警告。相当于: g++ Fish.cpp -Wall -Wextra 除了 NVCC 不理解这些,你必须通过它们: NVCC...

回答 2 投票 0

除了 CUDA 之外,C++ 中是否允许使用三重尖括号 `<<<` and `>>>`?

nvcc 可以识别此语法,以在 CUDA 内核调用中分配线程和块的数量,但是在 CUDA 之外是否有任何上下文可以使其成为合法的 C++? (任何 C++ 版本,包括草稿...

回答 1 投票 0

PyTorch cuda 内存不足问题

在 PyTorch 中训练模型时,我不断收到以下错误。我什至在代码开头添加了以下内容,但我不断收到此消息。我通过 Jupyter Notebook 运行它。

回答 1 投票 0

为什么 torch.version.cuda 和 deviceQuery 报告不同的版本?

我对我的系统上安装的 CUDA 版本以及我的软件能否有效使用有疑问。 我在网上做了一些研究,但找不到解决我的疑问的方法。 这个问题...

回答 3 投票 0

无法在 GPU 上应用大津阈值,opencv 会抛出以下错误:errorthreshold.cu:105: error: (-215:Assertion failed) type <= 4 in function 'threshold'

我正在尝试在 GPU 中完成所有图像处理而不是 CPU 处理: #编码=utf8 导入CV2 # 阅读 GPU 上的图像 图像 = cv2.cuda_GpuMat() image.upload(cv2.imread("sutil.jpeg&q...

回答 1 投票 0

具有多(CPU)线程的多GPU编程

我有一个令人尴尬的并行应用程序。是否可以启动多个CPU线程,以便一个线程管理一个GPU?如果可以,我应该在CPU端使用什么线程库?

回答 2 投票 0

为什么 CUDA 内核会因 CPU 代码而变慢?

我使用 CUDA 编写了一个屏蔽模板匹配算法。正如我所测试的,该算法的功能是正确的。然而,当我尝试比较该算法的 CUDA 实现时...

回答 1 投票 0

cuda 内核函数中的 for 循环给出错误的值

我有一些带有 2d 内核函数的 cuda 代码,如下所示: #包括 #包括 #包括 #包括 #定义r...

回答 1 投票 0

我可以强制进行某些计算,尽管它们的结果没有在内核中使用吗?

我正在尝试分析我的 CUDA 内核执行的计算的某一部分的“成本”。当然,还有分析的使用。但我想确定的是...

回答 1 投票 0

“cudaMalloc”无意中在多个 GPU 上分配内存,而不是仅 1 个

我在使用 CUDA 的系统上遇到了一个奇怪的问题。最初,我认为问题出在 pytorch 上,但这个自定义 CUDA C 代码仍然存在问题。 #包括 #包括 #

回答 1 投票 0

我收到有关错误的错误:Can't find libdevice directory ${CUDA_DIR}/nvvm/libdevice in tensorflow object_detection api

Windows版本:Windows 10 Pro 21H2 19044.1706 显卡:rtx2070 将张量流导入为 tf 进口火炬 打印(火炬.__版本__)#1.10.1+cu113 打印(火炬.版本.cuda)#11.3 打印(tf.__version__)#2.9.1...

回答 5 投票 0

Pytorch、随机数生成器和设备

我总是在我的 Pytorch 笔记本上放一个像这样的单元格: 设备=( “库达” 如果 torch.cuda.is_available() 否则“议员” 如果 torch.backends.mps.is_available() ...

回答 1 投票 0

PyTorch 安装问题:PyTorch 0.4.1 - Windows 11 上的 CUDA 9.2

我对深度学习的理解有限,所以希望通过PyTorch来学习。我更喜欢从旧版本的 PyTorch 开始。 我在 Windows 11 上下载并安装了 CUDA 9.2,我的 C...

回答 1 投票 0

获取 CUDA Thrust 以使用您选择的 CUDA 流

查看 CUDA Thrust 代码中的内核启动,似乎它们总是使用默认流。我可以让 Thrust 使用我选择的流吗?我是否遗漏了 API 中的某些内容?

回答 3 投票 0

如何调试代码 700“非法内存访问”,又名“CUDA_EXCEPTION_14,Warp 非法地址”?

我的代码正在显示 CUDA 调用“cudaStreamSynchronize(0)”时出错,代码为 700,在 489 上遇到非法内存访问 0# my_func(signed char const*, unsigned char const*, int*, i...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.