gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

Tensorflow 中未检测到 GPU

当我输入 Nvidia-semi 和 nvcc-V 时都可以工作。我创建了一个虚拟环境并安装了 Python (3.8) 和 TensorFlow。但是,当我尝试使用 NVIDIA GeForce RTX 3080 GPU (10+10) 处理器:Intel Xeo...

回答 1 投票 0

Virt-manager,GPU 直通“准备主机设备”冻结

我正在尝试使用 virt-manager 进行 GPU 直通的 Macos 虚拟机,但每次我使用 GPU 运行虚拟机时,libvirtd 都会完全冻结。 如果有人对这个主题有想法,那就太好了:) 我

回答 1 投票 0

将 Pytorch 张量移动到 GPU 时出现 PyTorch 分段故障(核心转储)

我有一台配备 RTX 6000 ADA GPU 的机器。 我们曾经使用 CUDA 版本 11.x,我使用了以下图像: nvcr.io/nvidia/pytorch:21.04-py3 (我使用 PyTorch 1.x)。 然而,我们的

回答 1 投票 0

体素...老实说,我需要知道从哪里开始

好吧,我知道体素基本上只是像素的体积版本。 在那之后,我不知道该寻找什么。 谷歌搜索没有显示任何教程,我找不到这方面的书

回答 6 投票 0

如何使用 pytorch lighting 在 AWS 云 GPU 上进行训练?

我目前正在做一个项目,并使用 pytorch lighting 编写 ML 模型。我正在训练的数据集相当大,因此无法在我的本地 GPU 上进行训练。为此,我...

回答 1 投票 0

我可以让tensorflow-gpu与NVIDIA GeForce MX130一起使用吗?

我知道这在任何意义上都不是机器学习的推荐设置,但我想使用我所拥有的设置。 我不是专家,有人告诉我 tf-gpu 应该与任何开发人员一起工作......

回答 5 投票 0

无法从“jax”导入名称“linear_util”

我正在尝试重现S5模型的实验,https://github.com/lindermanlab/S5,但是在解决环境时遇到了一些问题。当我运行 shell 脚本时./run_lra_c...

回答 1 投票 0

从 Windows PowerShell 运行 nvidia-smi?

我正在尝试使用 nvidia-smi 从 Windows PowerShell 检查我的 GPU,但无法让它工作。 我已经检查过这篇文章,但在我的 C:\Windows\System32\

回答 2 投票 0

如何将结构体数组移动到GPU?

假设我创建了树并初始化了它。 现在,我如何在 openCL 中将节点向量移动到 GPU? 结构 BVHNode { 边界框bbox; BoundingSphere bsphere; std::向量 假设我创建了树并初始化了它。 现在,我如何在 openCL 中将节点向量移动到 GPU? struct BVHNode { BoundingBox bbox; BoundingSphere bsphere; std::vector<int> obj_triangles; // Store triangle indices that is inside node's volume int parentIndex; // Index of the parent node (-1 for root) int level; std::vector<int> childrenIndices; // Indices of the child nodes } class BVHTree { public: std::vector<BVHNode> nodes; int maxDepth; int nodeSize; } I tried to move like this size_t dataSize = bvhTree.nodes.size() * sizeof(BVHNode); cl::Buffer d_BVHtree_buf(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, dataSize, BVHTree.nodes.data()); but it didn't work. GPU 既不支持函数递归,也不支持类,并且内存带宽对于 AoS 来说非常差(无合并)。 将树形数据结构扁平化为数组布局结构。您可能需要限制树深度并添加填充节点,以便数据索引规则间隔。或者,您可以使用间接寻址,这意味着添加一个额外的数组,其中包含节点的内存位置;这可以节省内存容量,但会破坏内存合并。您可以将固定深度递归作为函数调用的循环或链进行。

回答 1 投票 0

微调后的 llama2 模型在每个 GPU 上生成不同的结果

在使用llama2模型对个人数据训练的模型进行测试过程中,我遇到了以下问题: 在两个 GPU 上测试相同模型时,仅索引不同...

回答 1 投票 0

我无法安装加速包,因为它需要旧版本的base

我想安装加速1.3(当时是GPU加速包的最新版本),使用stack或cabal(最好是cabal)。它需要比我旧版本的基础...如何...

回答 1 投票 0

Haskell Cabal:无法安装加速包,因为它需要旧版本的基础

我想安装加速1.3(当时是GPU加速包的最新版本),使用stack或cabal(最好是cabal)。它需要比我旧版本的基础...如何...

回答 1 投票 0

pytorch GPU 在线性代数中的性能较慢

我正在 numpy 和 pytorch(cpu + gpu)之间做一个愚蠢的基准测试。我似乎无法理解 GPU 速度这么慢。 为了避免从 cpu t 来回移动阵列之间的开销...

回答 1 投票 0

hotplug vga(drm radeon) 将状态从断开连接更改为连接状态,但从 sys 中可见仍处于禁用状态

这是我的显卡: 03:00.0 VGA 兼容控制器:Advanced Micro Devices, Inc. [AMD/ATI] Caicos [Radeon HD 6450/7450/8450 / R5 230 OEM] 子系统:XFX Pine Group Inc. Caicos [Rade...

回答 1 投票 0

如何减少张量流模型使用的 GPU 量?

所以我目前使用的是Kaggle笔记本环境。我正在尝试建立一个用于图像分割的 U-Net 模型。当我构建模型时,它显示模式大小为 2.17mb,但这需要模型

回答 1 投票 0

有没有办法在nvcc中为设备代码(内核代码)启用`-Wconversion`?

我最近正在学习用CUDA编写前缀和算法。我有一个愚蠢的错误,我将浮点变量分配给失去精度的整数变量: // 第 3 阶段:填充最后一个元素 o

回答 1 投票 0

如何使用Numba CUDA JIT装饰器?

我已按照本教程使用 Numba CUDA JIT 装饰器:https://www.youtube.com/watch?v=-lcWV4wkHsk&t=510s。 这是我的Python代码: 将 numpy 导入为 np from timeit import default_timer as t...

回答 1 投票 0

在问题空间上启动单个内核与在较小的问题空间上多次启动相同的内核

最近我被要求在我的公司维护一个旧的图像处理项目(5年) 它使用 openCL。 有一段代码的工作原理如下 **如果(oneKernelFlag == true) 启动游戏...

回答 1 投票 0

我在 Tensorflow v2.15.0 中遇到 GPU 支持问题

我对张量流及其 GPU 支持有疑问。我运行了两个设置。一个正在工作,另一个不工作: 设置(工作): 张量流 v2.5.0 CUDA v.2.12 蟒蛇3.9.13 设置(不起作用...

回答 2 投票 0

如何限制TensorFlow中的可见设备?

我正在一台具有多个 GPU 的服务器上工作,我想选择一个具有足够可用空间的服务器。 使用pytorch,我发现只需设置os环境变量即可完成“

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.