“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。
我的模型在CPU机器上运行良好,但是当我尝试在我们的集群上重新运行它时(使用单个GPU和相同的数据集),我遇到了一个问题。在GPU机器上进行培训验证丢失时......
我曾尝试在Google Cloud Platform中创建GPU实例,但每次尝试创建实例时,它都会显示“您已达到0 GPU NVIDIA K80的限制”。我正在尝试创建一个实例......
我遵循了使用GPU支持安装tensorflow的说明,我仍然无法使用GPU运行tensorflow。我使用的是Windows 10.我安装了CUDA v9.1(用nvcc验证 - 版本),我......
任何人都可以对intel_gpu_top的输出有所了解吗?具体来说,什么是任务GAM,VS等(手册页没有多大帮助。)比特流忙什么意思?它似乎总是零......
目标:在内存中存储大矩阵(Radon矩阵),并将其传输到GPU内存中以进行大规模并行操作。问题:可怕的阅读时间,以及潜在的次优空间使用(...
我正在尝试使用OpenACC的嵌套功能来激活我的gpu卡的动态并行性。我有特斯拉40c和我的OpenACC编译器是PGI版本15.7。我的代码很简单。当我尝试编译时......
我能看到mxnet可用的gpus是什么吗? mxnet中的tensorflow的tf.test.gpu_device_name()有类似的东西吗?
Keras multi_gpu_model错误:“swig / python检测到'int64_t *'类型的内存泄漏,没有找到析构函数”
我使用tensorflow 1.5.0,tensorflow-gpu 1.3.0,keras 2.0.9,keras-gpu 2.1.4我用这段代码创建了我的模型:inputs = Input([1,44,44,44])x = Conv3D(64,(3,3,3),激活='relu',......
我需要的是在c ++程序中检索的Nvidia驱动程序的2号版本(例如368.39)。使用Windows 7 64b。以下是使用Nvidia的NVML库在64位应用程序中执行此操作的方法。 ...
我可以在Linux Mint 18(Cinnamon)上安装CUDA工具包吗?
我可以在Linux Mint 18.1 Serena(Cinnamon桌面环境)上安装CUDA工具包吗?我问这个是因为它没有列在支持的操作系统列表中,即使它具有相同的架构...
当我正在阅读BCM vc4芯片的VideoCoreIV-AG100-R规格时,有一段谈论:3D系统的所有渲染都是在平铺中,需要单独的装箱和渲染通道来渲染...
我正在使用Google Cloud进行深度神经网络的开发和培训。我已经达到了我可以用CPU做的限制,现在需要使用一个或多个GPU创建和实例。我有 ...
我知道nvidia-smi的概述如下:+ ------------------------------------- ---------------------------------------- + | NVIDIA-SMI 375.66驱动程序版本:375.66 ...
我写了一个CUDA程序,我有两个关于这个程序的问题。当我调用内核函数时,我知道block_len必须<= 1024,但我仍然设置block_len> 1024.当我用cuda -...调试时
正如你在问题的标题中看到的那样,我想知道一个warp如何导致另一个warp进入Idle状态。我在SO中读了很多Q / A,但我找不到答案。在任何时候,只有一个......
我是否必须通过glDelete *函数手动清理所有DisplayLists,Textures,(Geometry-)着色器等,或者当我的程序退出/崩溃时GPU mem是否会自动释放?注意: ...
在openACC上调用一些标志,仅为不允许并行化的循环获取警告
我正在使用openACC指令来增强现有的串行代码。我想知道是否有任何编译器标志会为编译器具有的循环调用警告生成...
使用带有MXnet后端的Keras 1.2.2重置GPU内存
我正在使用AWS p2.x8large并尝试使用k-fold交叉验证来评估我的模型。第一次重复后我的GPU内存已满,当我再次尝试训练时,我收到了一个cuda内存...
使用PYTHON 3.5和Backtrader在GPU上运行优化过程
我正在尝试Backtrader库的优化过程。我看到代码在多核CPU上运行得很好。完成后花了大约22.352761494772228秒...
我在使用Apache JMeter进行性能测试期间遇到了我的初始模型问题。错误:OOM在分配具有形状[800,1280,3]的张量并在/ job上键入float:localhost / replica:0 / ...