gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

内核调用的 OpenCL 开销

我想测量 OpenCL 内核在循环中的执行时间。当我使用 clGetEventProfilingInfo() 测量入队、提交和启动内核的时间时,我遇到了一大堆...

回答 1 投票 0

TensorFlow 训练在 CPU 和 GPU 上都很慢

我正在尝试使用 Tensorflow Keras 在我的机器上训练 CNN 模型。 这是我的机器规格: CPU:Ryzen 9 3900x(12核24线程) 显卡:GTX 970 4GB 模型 = models.Sequential([ 层。

回答 1 投票 0

如何在苹果M1 Pro芯片组上的XGBoost中启用GPU

我尝试在 Windows 上使用 GPU 进行 XGBoost 训练,并使用 device = cuda,它有效并且训练时间大大减少,现在我想在我的 Mac M1 Pro 上进行此实验。 如何为 XGBoost 启用 GPU ...

回答 1 投票 0

SYCL:未找到内核名称

关于这个问题还有其他类似的问题,但他们的答案并不能解决我的问题: 在抛出“sycl::_V1::runtime_error”实例后调用终止what():没有名为

回答 1 投票 0

有没有好的GLSL哈希函数?

所以我对这个问题的古老评论仍然得到了支持:这个 GLSL rand() 单行代码的起源是什么? 这让我开始思考,一个好的 GLSL 哈希函数应该是什么样的? ...

回答 2 投票 0

从 IMX8M 驱动 137,930 KHz 1080x1920 纵向 HDMI 屏幕

我需要制作一个固定频率的屏幕(带有新的自定义模式线): { DRM_MODE("1080x1920", DRM_MODE_TYPE_DRIVER, 137930, 1080, 1140, 1150, 1185, 0, 1920 年、1928 年……

回答 1 投票 0

Cuda 上的分段错误

我正在编写CUDA程序来处理图像。我遇到了分段错误问题,但我完全不知道为什么。我可能只是错过了一些小事,但经过几个小时的尝试纠正我的......

回答 1 投票 0

CPU 与 GPU 核心数量

我需要一些帮助来理解 GPU 内核与 CPU 内核的概念,以便进行并行计算。 当谈到 CPU 的核心时,它看起来非常简单。我有一个苏...

回答 2 投票 0

如何让Jupyter Notebook运行在多GPU中的某一指定GPU上?

我在一台 Jupyter Notebook 中有一些 PyTorch 代码,需要在一个指定的 GPU(即不是“gpu 0”)上运行。因为GPU 0正在被其他人工作。我已经尝试过这个: 导入操作系统 操作系统环境['

回答 2 投票 0

我有一个 RTX4060 TI,我想充分利用它的性能,这怎么可能? [已关闭]

目前使用了 10% 或 15%,但我想在本地机器上更快地训练模型。 GPU RTX 4060Ti 内存 32 GB DDR5 中央处理器17-12700 我想充分发挥系统的性能。但现在它...

回答 1 投票 0

GPU 上的可扩展性分析

我正在尝试使用我的 Quadro FX 5800 进行可扩展性分析,该 Quadro FX 5800 有 240 个内核,其运行时间尺度与内核数量是并行计算的经典研究。 我想知道哈...

回答 2 投票 0

使用GPU连接到本地运行时google colab需要tensorflow-gpu?

我的电脑没有安装 GPU,为了加快执行速度,我想通过连接到本地运行时来使用 google colab 建议的 GPU(因为我使用的数据集太大,无法上传到 google

回答 2 投票 0

从 open3d VoxelGrid 中提取 grid_index 非常慢

我正在尝试对 .obj 网格进行体素化(来自搅拌机)并将其转换为 numpy 数组(将其另存为 .npy 或 nii.gz 作为 CT-3D 图像)。 将 open3d 导入为 o3d 将 numpy 导入为 np 网格 = o3d.io.

回答 1 投票 0

GPU 编程、CUDA 或 OpenCL 还是? [已关闭]

GPU 编程的最佳方法是什么? 我知道: CUDA 非常好,有很多开发人员支持和非常好的 zo 调试,但仅限于 NVidia 硬件 OpenCL 非常灵活,可以在 NVidia、AMD 和

回答 1 投票 0

交换链获取和命令缓冲区提交时出现 SYNC-HAZARD-WRITE-AFTER-READ 错误

我编写了一个 Vulkan 验证错误的最小可重现代码示例,该错误显然与交换链获取和命令缓冲区提交之间的同步相关(请参阅完整代码 exa...

回答 1 投票 0

Metal - 优化内存访问

这个问题有两个部分,但它们密切相关: 问题1 Metal 是否提供了一种利用共享线程组内存的方法? 例如,在 CUDA 中,您可以显式地从 de...

回答 2 投票 0

尝试将onnxruntime与GPU一起使用。 SessionOptionsAppendExecutionProvider_CUDA 给出错误

我正在学习使用 GPU 进行 nxruntime 推理。我从 https://github.com/microsoft/onnxruntime-inference-examples.git 获取了代码。 我尝试了 main/c_cxx/fns_candy_style_transfer 案例。关注

回答 0 投票 0

pytorch 未检测到 GPU 的 spacy NER

我正在尝试训练 spacy3 NER 模型。我的机器上有可用的 GPU,规格如下: +------------------------------------------------ ----------------------------+ | NVIDIA-SMI 515.86...

回答 1 投票 0

为 GPU 分配参数将 is_leaf 设置为 false

如果我在 PyTorch 中创建一个参数,那么它会自动分配为叶变量: x = torch.nn.Parameter(torch.Tensor([0.1])) 打印(x.is_leaf) 这会打印出 True。据我了解,...

回答 2 投票 0

无法在设备代码上分配大小为 2116800 的数组

我有一个带有 3 个双变量的 Color 类和另一个带有 Color 数组的 Image 类。问题是我无法在 GPU 代码上分配大小为 1960*1080 的颜色数组: #包括 //

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.