gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息，请参阅“图形编程”的标记条目。对于使用GPU的通用编程，请参阅“gpgpu”的标记条目。对于特定的GPU编程技术，请参阅“opencl”，“cuda”和“thrust”的热门标签条目。

内核调用的 OpenCL 开销

我想测量 OpenCL 内核在循环中的执行时间。当我使用 clGetEventProfilingInfo() 测量入队、提交和启动内核的时间时，我遇到了一大堆...

gpu opencl

回答 1 投票 0

TensorFlow 训练在 CPU 和 GPU 上都很慢

我正在尝试使用 Tensorflow Keras 在我的机器上训练 CNN 模型。这是我的机器规格： CPU：Ryzen 9 3900x（12核24线程）显卡：GTX 970 4GB 模型 = models.Sequential([ 层。

machine-learning keras deep-learning gpu tensorflow2.0

回答 1 投票 0

如何在苹果M1 Pro芯片组上的XGBoost中启用GPU

我尝试在 Windows 上使用 GPU 进行 XGBoost 训练，并使用 device = cuda，它有效并且训练时间大大减少，现在我想在我的 Mac M1 Pro 上进行此实验。如何为 XGBoost 启用 GPU ...

machine-learning gpu xgboost xgbclassifier

回答 1 投票 0

SYCL：未找到内核名称

关于这个问题还有其他类似的问题，但他们的答案并不能解决我的问题：在抛出“sycl::_V1::runtime_error”实例后调用终止what()：没有名为

c++ fortran gpu nvidia sycl

回答 1 投票 0

有没有好的GLSL哈希函数？

所以我对这个问题的古老评论仍然得到了支持：这个 GLSL rand() 单行代码的起源是什么？这让我开始思考，一个好的 GLSL 哈希函数应该是什么样的？ ...

math glsl gpu numerics

回答 2 投票 0

从 IMX8M 驱动 137,930 KHz 1080x1920 纵向 HDMI 屏幕

我需要制作一个固定频率的屏幕（带有新的自定义模式线）： { DRM_MODE("1080x1920", DRM_MODE_TYPE_DRIVER, 137930, 1080, 1140, 1150, 1185, 0, 1920 年、1928 年……

linux-kernel gpu hdmi imx8

回答 1 投票 0

Cuda 上的分段错误

我正在编写CUDA程序来处理图像。我遇到了分段错误问题，但我完全不知道为什么。我可能只是错过了一些小事，但经过几个小时的尝试纠正我的......

c++ c cuda gpu

回答 1 投票 0

CPU 与 GPU 核心数量

我需要一些帮助来理解 GPU 内核与 CPU 内核的概念，以便进行并行计算。当谈到 CPU 的核心时，它看起来非常简单。我有一个苏...

gpu cpu cpu-architecture cpu-cores

回答 2 投票 0

如何让Jupyter Notebook运行在多GPU中的某一指定GPU上？

我在一台 Jupyter Notebook 中有一些 PyTorch 代码，需要在一个指定的 GPU（即不是“gpu 0”）上运行。因为GPU 0正在被其他人工作。我已经尝试过这个：导入操作系统操作系统环境['

jupyter-notebook pytorch gpu

回答 2 投票 0

我有一个 RTX4060 TI，我想充分利用它的性能，这怎么可能？ [已关闭]

目前使用了 10% 或 15%，但我想在本地机器上更快地训练模型。 GPU RTX 4060Ti 内存 32 GB DDR5 中央处理器17-12700 我想充分发挥系统的性能。但现在它...

deep-learning pytorch gpu

回答 1 投票 0

GPU 上的可扩展性分析

我正在尝试使用我的 Quadro FX 5800 进行可扩展性分析，该 Quadro FX 5800 有 240 个内核，其运行时间尺度与内核数量是并行计算的经典研究。我想知道哈...

parallel-processing cuda gpu scalability

回答 2 投票 0

使用GPU连接到本地运行时google colab需要tensorflow-gpu？

我的电脑没有安装 GPU，为了加快执行速度，我想通过连接到本地运行时来使用 google colab 建议的 GPU（因为我使用的数据集太大，无法上传到 google

python tensorflow gpu google-colaboratory

回答 2 投票 0

从 open3d VoxelGrid 中提取 grid_index 非常慢

我正在尝试对 .obj 网格进行体素化（来自搅拌机）并将其转换为 numpy 数组（将其另存为 .npy 或 nii.gz 作为 CT-3D 图像）。将 open3d 导入为 o3d 将 numpy 导入为 np 网格 = o3d.io.

python performance 3d gpu open3d

回答 1 投票 0

GPU 编程、CUDA 或 OpenCL 还是？ [已关闭]

GPU 编程的最佳方法是什么？我知道： CUDA 非常好，有很多开发人员支持和非常好的 zo 调试，但仅限于 NVidia 硬件 OpenCL 非常灵活，可以在 NVidia、AMD 和

cuda gpu opencl cpu hip

回答 1 投票 0

交换链获取和命令缓冲区提交时出现 SYNC-HAZARD-WRITE-AFTER-READ 错误

我编写了一个 Vulkan 验证错误的最小可重现代码示例，该错误显然与交换链获取和命令缓冲区提交之间的同步相关（请参阅完整代码 exa...

c gpu nvidia glfw vulkan

回答 1 投票 0

Metal - 优化内存访问

这个问题有两个部分，但它们密切相关：问题1 Metal 是否提供了一种利用共享线程组内存的方法？例如，在 CUDA 中，您可以显式地从 de...

ios gpu gpgpu metal

回答 2 投票 0

尝试将onnxruntime与GPU一起使用。 SessionOptionsAppendExecutionProvider_CUDA 给出错误

我正在学习使用 GPU 进行 nxruntime 推理。我从 https://github.com/microsoft/onnxruntime-inference-examples.git 获取了代码。我尝试了 main/c_cxx/fns_candy_style_transfer 案例。关注

windows gpu onnxruntime

回答 0 投票 0

pytorch 未检测到 GPU 的 spacy NER

我正在尝试训练 spacy3 NER 模型。我的机器上有可用的 GPU，规格如下： +------------------------------------------------ ----------------------------+ | NVIDIA-SMI 515.86...

python pytorch gpu named-entity-recognition spacy-transformers

回答 1 投票 0

为 GPU 分配参数将 is_leaf 设置为 false

如果我在 PyTorch 中创建一个参数，那么它会自动分配为叶变量： x = torch.nn.Parameter(torch.Tensor([0.1])) 打印（x.is_leaf）这会打印出 True。据我了解，...

pytorch cuda gpu autograd

回答 2 投票 0

无法在设备代码上分配大小为 2116800 的数组

我有一个带有 3 个双变量的 Color 类和另一个带有 Color 数组的 Image 类。问题是我无法在 GPU 代码上分配大小为 1960*1080 的颜色数组： #包括 //

c++ memory cuda gpu nvcc

回答 1 投票 0

gpu 相关问题

最新问题