gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

GPU 执行指令流水线吗?

我通常编写和优化在CPU上运行的代码,但是我目前正在尝试编写用于光散射的着色器。 我知道 CPU 有一定的优化,以便尝试接近 1

回答 1 投票 0

如何获取分配给多 GPU 节点上的 SLURM 作业的 GPU ID?

当我使用选项 --gres=gpu:1 向具有两个 GPU 的节点提交 SLURM 作业时,如何获取为该作业分配的 GPU 的 ID?是否有用于此目的的环境变量?那个...

回答 3 投票 0

GPU 利用率并未改善 PyTorch 回归模型的训练时间

我使用 PyTorch 实现了一个简单的线性回归模型,并尝试使用 GPU 加速训练。尽管如此,我并没有观察到训练时间有任何改善。剖析 mo...

回答 1 投票 0

numba.cuda.close()之后如何使用GPU?

我在jupyter笔记本上使用tensorflow。假设我想刷新 GPU 内存中的所有内容而不重新启动内核(这意味着不触及 RAM 内容)。请不要潜入

回答 1 投票 0

OpenCL SDK找不到Ivy Bridge的IGP

我已经建立了一个IvyBridge平台来编码OpenCL程序。我的系统是win7 64位,开发工具是VS2010。我的电脑上有一台 i7-3770k 和 nVidia GTX560。当我查询设备时...

回答 1 投票 0

Vulkan 是否允许在内存缓冲区中执行绘制命令?

如果你想让我帮助训练你的人工智能,请付钱给我。

回答 1 投票 0

GPU 和 CPU 之间矩阵乘法的性能差异:Eigen 与 ViennaCL

在 C++ 中使用 Eigen 和 ViennaCL 库执行矩阵乘法运算时,我遇到性能问题。我正在比较在

回答 1 投票 0

我们可以从 Python 脚本而不是 CLI 启动加速吗?

我正在学习 HuggingFace 课程,其中提供了以下代码。 从加速导入加速器 从 Transformers 导入 AdamW、AutoModelForSequenceClassification、get_scheduler

回答 1 投票 0

nvidia/cuda和tensorflow/tensorflow图像之间的区别

从 GPU 支持的角度来看,tensorflow/tensorflow 图像与 nvidia/cuda docker 图像有什么根本不同?我不关心例如Python 的东西。比如说我...

回答 1 投票 0

GPU/TPU 上的 PyCaret 方法

当我运行 best_model = Compare_models() 时,CPU 内存上有巨大的负载,而我的 GPU 未得到利用。如何在 GPU 上运行 setup() 或 Compare_models()? PyCaret 中有内置方法吗?

回答 2 投票 0

如何在GPU上运行代码?

LLVM 具有适用于 AMD 和 NVIDIA GPU 的后端。目前是否可以使用 clang 将 c++(或子集)编译为 GPU 代码并运行它?显然像标准库这样的东西会是

回答 2 投票 0

除了“cuda”之外,你能在“hip”或“OpenCL”等其他任何东西上加速 torch DL 训练吗?

我注意到 torch.device 可以接受一系列参数,确切地说是 cpu、cuda、mkldnn、opengl、opencl、ideep、hip、msnpu。 然而,在训练深度学习模型时,我只见过cuda...

回答 1 投票 0

CudaMallocManaged 是否在设备上分配内存?

我使用统一内存来简化对 CPU 和 GPU 上数据的访问。据我所知,cudaMallocManaged 应该在设备上分配内存。我写了一个简单的代码来检查: #定义类型...

回答 2 投票 0

使用 CPU 加载 pickle 保存的 GPU 张量?

我在 GPU 上使用 pickle 保存了 Bert 的最后一个隐藏层,以供后续流程使用。 # 输出是bert的最后一个隐藏层,在GPU上转换 将 open(文件名, 'wb') 作为 f: pk.dump(输出,...

回答 2 投票 0

确定cuda/GPU作为LLM生成器的设备时出现问题,总是回到CPU

背景:我正在尝试微调 Microsoft 的 Phi-2 模型,这是一个发布在 HuggingFace 上的 25 亿参数 LLM,其指令调整有超过 2000 条引用。我想创建一个

回答 1 投票 0

ModuleNotFoundError:没有名为“nvcc_plugin”的模块

我正在尝试在 Colab 上使用 cuda c,遵循了设置 cuda c 的整个过程,我遇到的唯一问题是加载扩展 ModuleNotFoundError:没有名为“nvcc_plugin”的模块 (https...

回答 1 投票 0

如何将 FFmpeg AVFrame 中的 CUdeviceptr 平面复制到我自己的 CUDA 内存中?

我试图将FFmpeg(CUDA)解码的帧平面复制到我自己的CUDA内存中,但我尝试了很多次,但都失败了。 1,来自 FFmpeg 文档,它说: /// HW 加速通过... 我试图将FFmpeg(CUDA)解码的帧平面复制到我自己的CUDA内存中,但我尝试了很多次,但都失败了。 1,来自 FFmpeg 文档,它说: /// <summary>HW acceleration through CUDA. data[i] contain CUdeviceptr pointers exactly as for system memory frames.</summary> @AV_PIX_FMT_CUDA = 117 这意味着 AVFrame.data[n] 是要复制的 CUdeviceptr。 2,我已经毫无问题地创建了自己的 CUDA 内存: var dstPtr = new CUdeviceptr(); var error = cuMemAlloc_v2(ref dstPtr, length); 3、尝试从AVFrame复制到dstPtr,但失败了: var dstPtr = new CUdeviceptr(); var error = cuMemAlloc_v2(ref dstPtr, length); // allocate a CUDA mem for test var plane = ffmpeg.av_frame_get_plane_buffer(avFrame, 0); // get the plane 0 info var srcPtr = new CUdeviceptr((long)plane->data); // get CUdeviceptr from data[0] error = cuMemcpyDtoD_v2(dstPtr, srcPtr, plane->size); // try to copy from avFrame into my own CUDA mem block Debug.Assert(error == CUResult.Success); // alway fail..... 复制结果一直是ErrorInvalidValue表示从AVFrame.data[0]返回的CUdeviceptr无效什么的.... 我真的不知道我做错了什么...... 顺便说一句,我已经创建了一个用于内存分配的 CUDA 上下文,也就是说,我将在分配内存之前将自己的 CUDA 上下文设置为当前上下文,此操作是否会破坏 FFmpeg 的当前上下文?那么副本会失败吗? 但是无论如何,无论我使用cuCtxPushCurrent_v2还是cuCtxSetCurrent,都不起作用。 这只是一个非常简单的复制测试,不是吗?但为什么......:( 答案很简单:使 FFmpeg 的 CUcontext 正确当前。

回答 1 投票 0

Rustgpu 如何索引到纹理数组中?

我正在尝试索引到 rustgpu 中的纹理数组,我有以下着色器代码: #![cfg_attr(target_arch = "spirv", no_std, feature(lang_items))] #![允许(内部特征)] 外部

回答 1 投票 0

包括GPU库的路径问题

我正在尝试使用 MAGMA (http://icl.cs.utk.edu/magma/) 在 GPU 上执行一些矩阵运算。我能够成功调用 CUDA 内核,并且没有任何问题。但当我...

回答 2 投票 0

尽管我在 Kaggle 中打开了 GPU,但为什么它没有被使用?

我已经在kaggle上上传了一个数据集(约73GB),并且我正在尝试预处理这些数据以用于模型训练目的。该数据集有很大的数量。缺失值,我正在尝试对其进行插值...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.