“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。
GPU 在我的 k8s 集群中资源有限,我想在整个集群中轻松定位这些 pod。 $ kubectl get pods -A -o jsonpath="{.items[*].spec['containers'][*].resources.requests}&quo...
nvidia-docker 中的 TensorFlow:调用 cuInit 失败:CUDA_ERROR_UNKNOWN
我一直致力于让一个依赖 TensorFlow 的应用程序作为带有 nvidia-docker 的 docker 容器工作。我已经在 tensorflow/tensorflow:latest-g 之上编译了我的应用程序...
我想在一个节点的多个 GPU 上训练一个模型,但使用以下代码 策略 = tf.distribute.MirroredStrategy() print("设备数量:{}".format(strategy.num_replicas_in_sync)...
图像显示了一切...我使用的是 Windows 11,CUDA v12.3 我已经更新了 NVIDIA 驱动程序,安装了 CUDA,并且我可以使用 nvidia-smi 通过命令行查看我的 GPU 我已将所有 cuDNN 文件放置在...
PyCuda中如何使用共享内存,LogicError: cuModuleLoadDataEx failed:遇到非法内存访问
我试图了解如何使用 PyCuda 处理共享内存。运行此代码来翻转输入向量: 将 pycuda.driver 导入为 drv 将 pycuda.gpuarray 导入为 gpuarray 导入 pycuda.autoini...
torch.cuda.is_avaiable 返回 False,nvidia-smi 不起作用
我正在尝试构建一个可以使用 GPU 运行的 docker 映像,这是我的情况: 我有 python 3.6,我从图像 nvidia/cuda:10.0-cudnn7-devel 开始。 Torch 没有看到我的 GPU。 Nvidia-SMI ...
我正在尝试通过编写cuda内核代码来均衡直方图。主要问题是,在图像的某一行之前,操作似乎是正确的,之后输出是错误的,但我不能
在 Windows 10 上使用 VS Code 启用 GPU 进行 Python 编程 (llama-cpp-python)
在 Python 编程期间,我在使用 4GB Nvidia P100 GPU 的 32GB Windows 10 机器上启用 GPU 时遇到了很多困难。我的法学硕士在推理时没有使用我机器的 GPU。花了一些钱后...
首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...
想要安装peft并加速兼容torch 1.9.0+cu111
我想安装peft并加速: !pip install -q git+https://github.com/huggingface/peft.git !pip install -q git+https://github.com/huggingface/accelerate.git 但由于我的torch版本是1.9.0...
在 device_lib.list_local_devices() 中,列出了 GPU,但在 tf.config.list_physical_devices('GPU') 中没有列出。如何启用 GPU 的使用? 当我运行以下代码时 打印(device_lib.list_local_d...
大型语言模型可以使用比允许的默认分数更多的 GPU 内存。在配备 M1 Max 和 32GB RAM 的 MacBook 上,我可以使用以下命令设置 GPU 内存使用上限
如何计算应用程序的 FLOPS? 如果我有执行指令的总数,我可以将其除以执行时间。但是,如何统计执行的指令数呢? 我的
运行时错误:CUDA错误:没有内核映像可在具有3090 cuda11.3 torch10.1的设备上执行
您好,我尝试在 RTX 3090 上运行评估代码,但遇到以下问题: [13.73019 90.45654 -0.80213207 0.57002985] [12.367015 90.64196 1.0528708 0.56709075] ...
我有一些关于将 Numpy 与 GPU (nvidia GTX 1080 Ti) 一起使用的基本问题。我是 GPU 新手,想确保我正确使用 GPU 来加速 Numpy/Python。我在
JOCL CL_OUT_OF_RESOURCES 仅当已分配值时
我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...
我有一个两个 GPU 的 NVIDIA 驱动程序,在 ubuntu 上使用 python 代码显示它是一个 GPU ID
我有一个 2 A100 PCIE (80GB VRAM) GPU,但 NVIDIA 给我的可见 GPU 是 1。 例如 0 索引 GPU,我无法在 ubuntu 服务器上获取 1 索引 GPU。 这是代码结果 Pytorch 图像...
如何在cupy.RawKernel或cupy.RawModule中使用wmma::load_matrix_sync等WMMA函数? 有人可以提供一个最小的例子吗?
运行“sinfo ... --Format=GresUsed”等命令时如何解释 GresUsed 的输出格式 我的节点的输出看起来像这样: GPU:h100:0(IDX:不适用) 做什么...
据我所知,可以在命令行中使用-hwaccel_device或-gpu来指定GPU设备,但是如何在使用API时指定GPU呢? 我试图在 ffmpeg.c 中找到它,但这太复杂了......