gpu-programming 相关问题

请参阅[tag:gpu]的标签条目。

Nsight在VS10中跳过(忽略)断点 Cuda工作正常,nsight一直跳过几个断点。

我用的是nsight 2.2,Toolkit 4.2,最新的nvidia驱动,我的电脑里用的是几个GPU。Build customize 4.2. 我在CUDA的项目属性中设置了 "generate GPU ouput",nsight监控器打开了(...

回答 4 投票 5

创建cuda上下文管理器失败

我正在用PhysiX实现流体模拟器。不幸的是,cuda上下文管理器出了问题,我有一个问题,识别它是什么。我有一个init方法,它看起来像这样: void ...。

回答 1 投票 1

计算着色器。为什么是RWTexture2d<float4>?

我有一个ID3D11Texture2D和ID3D11UnorderedAccessView,格式为DXGI_FORMAT_R8G8B8A8_UNORM,着色器为RWTexture2d。 tex: register(u0); [numthreads(32, 32, 1)] void main(uint3 dtid : ...)

回答 1 投票 0

OpenCL 2.0设备命令队列不断被填满并停止执行。

我正在利用OpenCL的enqueue_kernel()函数从GPU动态地enqueue内核,以减少不必要的主机交互。下面是一个简化的例子,说明了我在GPU中试图做的事情。

回答 1 投票 0

如何在一次openCv中更快地画出上千个圆圈--(可能使用GPU)

我需要在图像的给定区域(视频的帧)上绘制数千个点。使用循环是最简单的方法。 while i < num: x = random.randint(min_x, max_x) y = ...

回答 1 投票 1

CUDA:这样使用1D线程块的方式是否正确?

我是CUDA的新手。我用的是几个1D的线块。只是线的一个维度,和块的一个维度。问题是,我有一个2维的数组,它必须像接下来的部分......。

回答 0 投票 0

如何将内存分配初始化为1s?

a =(int *)malloc(sizeof(int)* N); b =(int *)malloc(sizeof(int)* N);如果我分配了一些内存,如何将a和b都初始化为1的?

回答 1 投票 0

将内存分配初始化为1

a =(int *)malloc(sizeof(int)* N); b =(int *)malloc(sizeof(int)* N);如果我分配了一些内存,如何将a和b都初始化为1的?

回答 1 投票 0

反正还有在GPU上运行Tensorflow代码吗?

[这是我的代码,我想将GPU用于我的代码。当前,它正在CPU上运行。 elf.graph = tf.Graph()与self.graph.as_default():self.face_graph = tf.GraphDef()fid = tf ....

回答 1 投票 0

Pytorch:GPU内存泄漏

我推测在使用PyTorch框架进行Conv网络训练时,我面临GPU内存泄漏。下图为解决此问题,我添加了-os.environ ['CUDA_LAUNCH_BLOCKING'] =“ 1”,此问题已解决...

回答 1 投票 0

将ROCm与Pycharm一起使用,Ubuntu 20.04

我一直在尝试通过AMD卡实现GPU加速以进行深度学习。尝试使用基于Docker的方法,直到最后才发现PyCharm中的Docker解释器...

回答 1 投票 0

随机数种子重叠问题

我正在使用Matlab GPU计算来运行仿真。我怀疑我可能会遇到“随机数种子”重叠的问题。我的代码如下N = 10000; v = rand(N,1); p = [0:0.1:1]; pA = [0:0.1:...

回答 1 投票 0

Grover模型的多GPU训练

我正在尝试使用tensorflow == 1.13.1在多个GPU上训练Grover的鉴别器模型。该模型的默认配置假定对多个TPU进行训练,并被证明可以在具有...

回答 1 投票 3

Compute Shaders:为什么使用RWTexture2d ?

已编辑的问题:我有一个ID3D11Texture2D和ID3D11UnorderedAccessView,格式为DXGI_FORMAT_R8G8B8A8_UNORM和着色器RWTexture2d tex:register(u0); [numthreads(32,32,1)] void ...

回答 1 投票 0

如何在OpenACC中不并行化内部循环

我是使用OpenACC进行GPU编程的初学者。我正在尝试进行直接卷积。卷积由6个嵌套循环组成。我只希望将第一个循环并行化。我给了杂注...

回答 1 投票 0

在Matlab中使用多个GPU

我正在使用Matlab,我想利用我的2个GPU,我有一个不适合1个GPU的大矩阵,但一半的矩阵适合1个GPU。因此,我想将矩阵切成两半,让我的每个人都... ...>

回答 1 投票 0

将CPU和GPU与OpenCL结合使用时加速

我有一个使用OpenCL在多个设备上拆分矩阵矢量乘法的应用程序。我在装有Intel Xeon CPU和三个相同的NVIDIA Kepler的计算机上测试了该应用程序...

回答 1 投票 -1

针对新ArrayFire版本的问题自适应MatchFilter算法

我正在尝试将匹配的过滤器算法(在此处提供)用于arrayfire版本3.6.4。这就是我最终得到的结果:#include using namespace af; struct SAR_data {//! SAR ...

回答 1 投票 1

当缓存的内存足够时无法分配GPU内存

我正在使用Python3(CUDA 10.1和Intel MKL)(Pytorch 1.3.1)在AWS EC2深度学习AMI机器(Ubuntu 18.04.3 LTS(GNU / Linux 4.15.0-1054-aws x86_64v))上从头开始训练vgg16模型。 )并面向...

回答 1 投票 3

vb.net中的GPU处理

我有一个程序大约需要24小时才能运行。这些都是用VB.net编写的,大约有2000行。它已经是多线程的,并且可以正常工作(经过一些汗水和眼泪)。我...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.