gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

OpenACC中的嵌套指令

我正在尝试使用OpenACC的嵌套功能来激活我的gpu卡的动态并行性。我有特斯拉40c和我的OpenACC编译器是PGI版本15.7。我的代码很简单。当我尝试编译时......

回答 2 投票 1

有没有办法检查mxnet是否使用我的gpu?

我能看到mxnet可用的gpus是什么吗? mxnet中的tensorflow的tf.test.gpu_device_name()有类似的东西吗?

回答 1 投票 3

Keras multi_gpu_model错误:“swig / python检测到'int64_t *'类型的内存泄漏,没有找到析构函数”

我使用tensorflow 1.5.0,tensorflow-gpu 1.3.0,keras 2.0.9,keras-gpu 2.1.4我用这段代码创建了我的模型:inputs = Input([1,44,44,44])x = Conv3D(64,(3,3,3),激活='relu',......

回答 1 投票 2

如何在x86程序中以编程方式获取Nvidia驱动程序版本?

我需要的是在c ++程序中检索的Nvidia驱动程序的2号版本(例如368.39)。使用Windows 7 64b。以下是使用Nvidia的NVML库在64位应用程序中执行此操作的方法。 ...

回答 2 投票 1

我可以在Linux Mint 18(Cinnamon)上安装CUDA工具包吗?

我可以在Linux Mint 18.1 Serena(Cinnamon桌面环境)上安装CUDA工具包吗?我问这个是因为它没有列在支持的操作系统列表中,即使它具有相同的架构...

回答 1 投票 -1

什么是GPU binning传递

当我正在阅读BCM vc4芯片的VideoCoreIV-AG100-R规格时,有一段谈论:3D系统的所有渲染都是在平铺中,需要单独的装箱和渲染通道来渲染...

回答 1 投票 3

无法在Google Cloud上扩展GPU配额

我正在使用Google Cloud进行深度神经网络的开发和培训。我已经达到了我可以用CPU做的限制,现在需要使用一个或多个GPU创建和实例。我有 ...

回答 1 投票 1

如何查询某个PID的NVIDIA GPU参数?

我知道nvidia-smi的概述如下:+ ------------------------------------- ---------------------------------------- + | NVIDIA-SMI 375.66驱动程序版本:375.66 ...

回答 1 投票 0

“CudaLaunch返回(0x9)”,以及程序计时问题

我写了一个CUDA程序,我有两个关于这个程序的问题。当我调用内核函数时,我知道block_len必须<= 1024,但我仍然设置block_len> 1024.当我用cuda -...调试时

回答 1 投票 1

如何使翘曲导致另一个翘曲处于空闲状态?

正如你在问题的标题中看到的那样,我想知道一个warp如何导致另一个warp进入Idle状态。我在SO中读了很多Q / A,但我找不到答案。在任何时候,只有一个......

回答 1 投票 0

需要OpenGL GPU内存清理吗?

我是否必须通过glDelete *函数手动清理所有DisplayLists,Textures,(Geometry-)着色器等,或者当我的程序退出/崩溃时GPU mem是否会自动释放?注意: ...

回答 5 投票 8

在openACC上调用一些标志,仅为不允许并行化的循环获取警告

我正在使用openACC指令来增强现有的串行代码。我想知道是否有任何编译器标志会为编译器具有的循环调用警告生成...

回答 1 投票 0

使用带有MXnet后端的Keras 1.2.2重置GPU内存

我正在使用AWS p2.x8large并尝试使用k-fold交叉验证来评估我的模型。第一次重复后我的GPU内存已满,当我再次尝试训练时,我收到了一个cuda内存...

回答 1 投票 2

使用PYTHON 3.5和Backtrader在GPU上运行优化过程

我正在尝试Backtrader库的优化过程。我看到代码在多核CPU上运行得很好。完成后花了大约22.352761494772228秒...

回答 2 投票 4

错误:分配具有形状的张量时的OOM

我在使用Apache JMeter进行性能测试期间遇到了我的初始模型问题。错误:OOM在分配具有形状[800,1280,3]的张量并在/ job上键入float:localhost / replica:0 / ...

回答 2 投票 -3

Halide :: GPU上的缓冲区

我已经有一个应用程序,它接收输入图像,将它们复制到GPU,然后一些CUDA过滤器应用于该图像。所以,当我想实现一个新的过滤器时,我只写过滤器......

回答 1 投票 0

如何判断本地PC机是否支持d2d硬件加速

硬件加速是Direct2D支持的功能。这是我的问题。据我所知,硬件加速受GPU模型,驱动程序版本等限制。有谁知道......的细节

回答 1 投票 0

(tensorflow)我是否正确使用两个gpus?

(我很抱歉,如果这个问题太新手,但我不太明白,想要仔细检查我是否正确地使用两个gpus并行,我问你以下问题。)两个......

回答 1 投票 0

GPU cuda代码可以在多个GPU卡上运行而无需任何实现吗?

我已经有一个基于GPU CUDA C ++的代码,可以在单个NVIDIA显卡上运行良好。是否可以通过添加新的NVIDIA卡来加速计算并在2个GPU卡上运行代码(...

回答 1 投票 -1

我如何与Metal沟通,以避免GPU和CPU之间的数据冲突

因此,当涉及到iOS的图形时,共享内存模型调节在图形应用程序中访问内存的方式缓冲是一个重要的概念。想法是你缓冲你的数据......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.