gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

在GLSL中使用浮点变量作为迭代器时如何避免循环中重复次数的上限?

我正在使用 OpenGL 制作一个简单的片段着色器可视化工具,以轻松显示和使用 GLSL 片段着色器。我正在使用 GLFW 用 C 语言制作它。当然,我的参考是shadertoy,我...

回答 1 投票 0

OpenCL 中逐元素矩阵乘法速度

我编写了一个小型 OpenCL 应用程序,用于计算两个矩阵的乘积。现在我注意到,如果矩阵的大小超过 8192 x 8192,则会出现显着的性能下降(计算...

回答 1 投票 0

在火炬分布式训练中获取本地世界大小

假设我有 2 台机器,每台机器有 4 个 GPU。假设训练算法的每个实例需要 2 个 GPU。 我想运行 4 个进程,每台机器 2 个,每个进程使用 2 个 GPU。 哈...

回答 3 投票 0

如何根据分配的节点规格在 Google Colab 笔记本中设置批量大小

与这个问题有关。 @Vladimir Sotnikov 的答案给出了获取分配的 colab 节点的配置信息的说明。他还展示了如何使用 pytorch 和

回答 1 投票 0

如何在VMware Workstation上使用物理计算机的GPU?

我很清。 我想通过在虚拟机VMware Workstation上使用ffmpeg来使用GPU来加速视频转码时间。 我使用命令 lspci | grep VGA,输出为 00:0f.0 VGA 兼容

回答 1 投票 0

在不下载CUDA的情况下安装支持GPU的torch?

PyTorch 似乎与其自己的 CUDA 库捆绑在一起。但是,如果我们已经有了它们(可能是更新的)并且只想安装火炬怎么办? 还有额外的问题:为什么 PyTorch 无法检测或接受......

回答 1 投票 0

运行 mae_vit_* 模型时 CUDA 11 内存不足,但 CUDA 10 可以工作

我在尝试从 GitHub 上的 Mae 存储库运行 mae_vit_large_patch16_dec512d8 和 mae_vit_huge_patch16_dec512d8 模型时遇到内存问题。我正在单个 112x112 上进行训练...

回答 1 投票 0

运行时错误:CUDA 错误:运行 mae_vit_large_patch16_dec512d8 和 mae_vit_huge_patch16_dec512d8 模型时内存不足”

我在尝试从 GitHub 上的 Mae 存储库运行 mae_vit_large_patch16_dec512d8 和 mae_vit_huge_patch16_dec512d8 模型时遇到内存问题。我正在单个 112x112 上进行训练...

回答 1 投票 0

Slurm 中的 GPU 分配:--gres 与 --gpus-per-task,以及 mpirun 与 srun

Slurm 中有两种分配 GPU 的方法:要么是通用的 --gres=gpu:N 参数,要么是特定的参数,如 --gpus-per-task=N。还有两种方法可以在批处理 SC 中启动 MPI 任务...

回答 2 投票 0

如何指定PyTorch脚本使用特定的GPU单元?

我有一个 Python 训练脚本,它利用 CUDA GPU 来训练模型(此处提供 Kohya Trainer 脚本)。它遇到内存不足错误: OutOfMemoryError:CUDA 内存不足。尝试过

回答 1 投票 0

如何修复此 Databricks 分布式培训教程工作簿中的此运行时错误

我正在关注从这篇文章中找到的这个笔记本。我正在尝试使用单个节点和多个 GPU 来微调模型,因此我运行所有内容直至“运行本地训练&...

回答 1 投票 0

金属渲染视图(MTKView)中闪烁

我正在尝试为某种图形软件创建一个“无限网格”,类似于 Desmos 或 Geogebra 中的网格。我希望使用金属渲染视图。我的问题是,尽管...

回答 1 投票 0

测量nvidia gpu的利用率

我正在寻找记录GPU级别利用率的方法。我有两个利用率的定义,乐观地我希望能够计算这两个定义: 正在运行/已使用的cuda数量...

回答 2 投票 0

Tensorflow 警告:TensorFlow 不是使用与计算能力 8.6 兼容的 CUDA 内核二进制文件构建的

我有一个不支持 AVX 的旧版 Intel Core i7 950 CPU、一个具有计算能力 8.6 的较新 NVIDIA RTX 3060 Ti GPU 和 Windows 10 操作系统。尽管默认的 Tensorflow 分布需要 AVX

回答 1 投票 0

GPU 和 CPU 笔记本之间 XGBoost.regressor 的 MAE 值不同,为什么?

我正在使用 optune 寻找更好的 XGBoost.regressor 选项。我有一个笔记本电脑实例在本地计算机上运行(在处理器上,我的显卡不支持机器学习),一个...

回答 1 投票 0

Google Colab Pro+ 上的 GPU RAM 不足,无法访问具有 40GB RAM 的 A100 GPU

目前采用 Colab Pro+ 计划,可访问 A100 GPU w 40 GB RAM。然而,我使用 LLM 的应用程序仍然崩溃,因为 GPU RAM 耗尽。有什么方法可以暂时增加 GPU RAM,或者...

回答 1 投票 0

加入 scikit-learn KMeans 替代 GPU

我想知道什么是 from sklearn.cluster import KMeans 的良好替代品。网上其他人建议使用 Nvidia 的 RAPIDS 包中的 cuML,但这无法编译或者我...

回答 1 投票 0

OpenCL 内核和传统循环

我正在研究OpenCL,我不明白C/C++代码中的传统循环与内核代码之间的关系。 只是为了弄清楚这样的情况: 所以我的问题是:在传统...

回答 1 投票 0

AMD 的 GCN 和 VEGA 指令集中的 V_SUB_F64

为什么AMD的GCN和VEGA指令集中没有V_SUB_F64指令?他们是如何实现双精度减法的?

回答 1 投票 0

OpenCL 中的工作项分支分歧,它是如何工作的?

我正在研究有关OpenCL的一些东西,我不太理解“工作项分歧或发散控制流”的概念。 正如我们在下图中看到的,有一些...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.