“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。
我使用的是带有 Nvidia DSC 支持显卡的 Windows 电脑。支持 DSC 的显示器。和未知的显示端口电缆。设置 4k 24bit/px 144Hz。 DSC 是否开启? 上网查了一下,没有发现什么。。
我正在使用 Huggingface 生成文本的 bert 嵌入,但对于我的 Mac 和 Linux 平台上的相同文本,它们略有不同。例如,一对结果: 苹果 [0.98320478200912...
有没有办法从 Ubuntu/Linux 命令行验证哪个用户正在使用 NVidia GPU 资源(如内存等)的百分比?
训练(NLP)Transformer用于文本摘要,在8Giga RTX2070上使用TensorFlow
大家好,我正在使用张量流和变压器架构构建一个文本摘要器。 出于学习目的,我有以下参数 编码器词汇大小:100000 解码器词汇大小...
在 Navi10 (RX 5700 XT) 和 HSA_OVERRIDE_GFX_VERSION=10.3.0 上使用 Pytorch 的 AMD ROCm 失败
我看到这篇文章建议使用 HSA_OVERRIDE_GFX_VERSION=10.3.0 在 5700XT 卡上运行带有 ROCm 的 Pytorch,但我无法让它工作。 我的步骤: sudo pacman -S python-pytorch-opt-rocm git cl...
金属着色语言在读取或写入纹理时是否始终采用 4 分量像素格式?
我只是想确认我使用 1、2 或 3 分量像素格式的纹理的方式是在 Metal 中执行此操作的正确方法。 假设我们已经分配了一个纹理 PixelFormat = .rg32Float i...
未设置 --gres 时,Slurm 不限制作业中可用 GPU 的数量
我有一个带有 4 个 GPU 的一体化节点。我遇到的问题是,如果未设置 --gres=gpu:n,则所有 GPU 都可用于作业。 环境“$CUDA_VISIBLE_DEVICES”为空。这是预料之中的。 这...
使用 jupyter 在 PyTorch 上默认在 M1 GPU 上创建张量
现在,如果我想在 GPU 上创建张量,我必须手动完成。对于上下文,我确信 GPU 支持是可用的 print(torch.backends.mps.is_available())# 这确保了 c...
我无法找到 cuda 驱动程序 12.2 的 Pytorch 版本。谁能指导我在哪里可以找到有帮助的材料。 我当前安装的 pytorch 版本为 11.7。在训练
无法使用 GPU 和 CUDA 运行 Docker Windows 容器
我有一个使用机器学习方法的对象检测应用程序,它是基于 GPU 的 CUDA。 我有运行应用程序所需的 .dll 文件。在我的笔记本电脑上一切正常。 但我需要记录...
Tensorflow 仅使用 CPU,不会使用 GPU。我认为它是因为它期望 Cuda 10.0 而它找到 10.2。 我已经安装了 10.2,但已清除它并安装了 10.0。 我正在运行 Ubuntu ...
int4和int2数组的内存布局是怎样的?认为, int4 M[2]; M[0]=0xA; M[1]=0x5; 我应该在包含 M(0) 和 M(1) 的单个字节中看到什么?是0xA5还是0x5A?我知道...
我想快速将一个巨大的GPU缓冲区的一小部分(几个字节)复制到CPU。 ILGPU CopyToCpu 需要很长时间,因为它复制整个缓冲区。 ILGPU有没有办法复制一个小...
PyTorch RuntimeError t == DeviceType::CUDAINTERNAL ASSERT FAILED
使用此 Trainer 配置,PyTorch Lightning 模型在 CPU 上运行得非常好: 教练=教练( 显卡=0, 最大纪元=10, 梯度剪辑值=2, 回调=[pl.callbacks.progress.
使用 GCC 编译器和 OpenMP 编程,我现在正在开发一个将数据卸载到 Nvidia GPU 的项目。我需要一些帮助来解决问题。 默认设置使用虚拟 GPU t...
我在 ML 世界中还是个新手,对于使用 XGBoost 模型完成的项目,我尝试使用 GPU 进行 GridSearch 和参数调整。不幸的是,我感觉我的 GPU 没有被使用,如信息所示......
int4和int2数组的内存布局是怎样的?认为, int4 M[2]; M[0]=0xA; M[1]=0x5; 我应该在包含 M(0) 和 M(1) 的单个字节中看到什么?是0xA5还是0x5A?我知道...
Torch argmax() 在 Mac MPS 和 CPU 上返回不同的张量结果
Torch argmax() 在 CPU 上返回正确的张量结果,但在 MPS 上返回错误的结果。 我有一个矩阵 target_mixtures,其中 print(target_mixtures[0]) 会给出 张量([0.0010, 0.6827, 0.0010, 0.0261, 0...
我一直在使用 Kaggle GPU 来训练我的深度学习模式。然而,连续运行 12 小时后,Kaggle 内核停止,因此训练停止,我必须重新...