gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

如何判断是否使用了显示流压缩?

我使用的是带有 Nvidia DSC 支持显卡的 Windows 电脑。支持 DSC 的显示器。和未知的显示端口电缆。设置 4k 24bit/px 144Hz。 DSC 是否开启? 上网查了一下,没有发现什么。。

回答 1 投票 0

模型输出在不同平台上略有不同是否正常?

我正在使用 Huggingface 生成文本的 bert 嵌入,但对于我的 Mac 和 Linux 平台上的相同文本,它们略有不同。例如,一对结果: 苹果 [0.98320478200912...

回答 1 投票 0

如何查找哪个用户正在使用 GPU 以及使用比例是多少?

有没有办法从 Ubuntu/Linux 命令行验证哪个用户正在使用 NVidia GPU 资源(如内存等)的百分比?

回答 1 投票 0

训练(NLP)Transformer用于文本摘要,在8Giga RTX2070上使用TensorFlow

大家好,我正在使用张量流和变压器架构构建一个文本摘要器。 出于学习目的,我有以下参数 编码器词汇大小:100000 解码器词汇大小...

回答 1 投票 0

在 Navi10 (RX 5700 XT) 和 HSA_OVERRIDE_GFX_VERSION=10.3.0 上使用 Pytorch 的 AMD ROCm 失败

我看到这篇文章建议使用 HSA_OVERRIDE_GFX_VERSION=10.3.0 在 5700XT 卡上运行带有 ROCm 的 Pytorch,但我无法让它工作。 我的步骤: sudo pacman -S python-pytorch-opt-rocm git cl...

回答 1 投票 0

金属着色语言在读取或写入纹理时是否始终采用 4 分量像素格式?

我只是想确认我使用 1、2 或 3 分量像素格式的纹理的方式是在 Metal 中执行此操作的正确方法。 假设我们已经分配了一个纹理 PixelFormat = .rg32Float i...

回答 1 投票 0

在 GPU 上运行 C# 代码

我对GPU编程概念和API一无所知。我有几个问题: 是否可以编写一段托管 C# 代码并将其编译/翻译为某种模块,这可以是

回答 7 投票 0

未设置 --gres 时,Slurm 不限制作业中可用 GPU 的数量

我有一个带有 4 个 GPU 的一体化节点。我遇到的问题是,如果未设置 --gres=gpu:n,则所有 GPU 都可用于作业。 环境“$CUDA_VISIBLE_DEVICES”为空。这是预料之中的。 这...

回答 1 投票 0

使用 jupyter 在 PyTorch 上默认在 M1 GPU 上创建张量

现在,如果我想在 GPU 上创建张量,我必须手动完成。对于上下文,我确信 GPU 支持是可用的 print(torch.backends.mps.is_available())# 这确保了 c...

回答 4 投票 0

cuda 12.2 的 Pytorch 版本

我无法找到 cuda 驱动程序 12.2 的 Pytorch 版本。谁能指导我在哪里可以找到有帮助的材料。 我当前安装的 pytorch 版本为 11.7。在训练

回答 2 投票 0

无法使用 GPU 和 CUDA 运行 Docker Windows 容器

我有一个使用机器学习方法的对象检测应用程序,它是基于 GPU 的 CUDA。 我有运行应用程序所需的 .dll 文件。在我的笔记本电脑上一切正常。 但我需要记录...

回答 1 投票 0

无法dlopen某些GPU库。跳过注册 GPU 设备

Tensorflow 仅使用 CPU,不会使用 GPU。我认为它是因为它期望 Cuda 10.0 而它找到 10.2。 我已经安装了 10.2,但已清除它并安装了 10.0。 我正在运行 Ubuntu ...

回答 3 投票 0

4位整型数组的内存布局

int4和int2数组的内存布局是怎样的?认为, int4 M[2]; M[0]=0xA; M[1]=0x5; 我应该在包含 M(0) 和 M(1) 的单个字节中看到什么?是0xA5还是0x5A?我知道...

回答 2 投票 0

ILGPU CopyToCpu 切片

我想快速将一个巨大的GPU缓冲区的一小部分(几个字节)复制到CPU。 ILGPU CopyToCpu 需要很长时间,因为它复制整个缓冲区。 ILGPU有没有办法复制一个小...

回答 1 投票 0

PyTorch RuntimeError t == DeviceType::CUDAINTERNAL ASSERT FAILED

使用此 Trainer 配置,PyTorch Lightning 模型在 CPU 上运行得非常好: 教练=教练( 显卡=0, 最大纪元=10, 梯度剪辑值=2, 回调=[pl.callbacks.progress.

回答 2 投票 0

我应该如何为特定 GPU 修改 GCC 运行时编译器选项

使用 GCC 编译器和 OpenMP 编程,我现在正在开发一个将数据卸载到 Nvidia GPU 的项目。我需要一些帮助来解决问题。 默认设置使用虚拟 GPU t...

回答 1 投票 0

运行 XGBoost 时不使用 GPU

我在 ML 世界中还是个新手,对于使用 XGBoost 模型完成的项目,我尝试使用 GPU 进行 GridSearch 和参数调整。不幸的是,我感觉我的 GPU 没有被使用,如信息所示......

回答 0 投票 0

int4类型数组的内存布局

int4和int2数组的内存布局是怎样的?认为, int4 M[2]; M[0]=0xA; M[1]=0x5; 我应该在包含 M(0) 和 M(1) 的单个字节中看到什么?是0xA5还是0x5A?我知道...

回答 2 投票 0

Torch argmax() 在 Mac MPS 和 CPU 上返回不同的张量结果

Torch argmax() 在 CPU 上返回正确的张量结果,但在 MPS 上返回错误的结果。 我有一个矩阵 target_mixtures,其中 print(target_mixtures[0]) 会给出 张量([0.0010, 0.6827, 0.0010, 0.0261, 0...

回答 0 投票 0

用于深度学习的 Kaggle GPU

我一直在使用 Kaggle GPU 来训练我的深度学习模式。然而,连续运行 12 小时后,Kaggle 内核停止,因此训练停止,我必须重新...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.