gpu 相关问题

“图形处理单元”的缩写。有关编程传统图形应用程序的信息,请参阅“图形编程”的标记条目。对于使用GPU的通用编程,请参阅“gpgpu”的标记条目。对于特定的GPU编程技术,请参阅“opencl”,“cuda”和“thrust”的热门标签条目。

如何列出所有在k8s(如gpu)中请求特殊资源的pod

GPU 在我的 k8s 集群中资源有限,我想在整个集群中轻松定位这些 pod。 $ kubectl get pods -A -o jsonpath="{.items[*].spec['containers'][*].resources.requests}&quo...

回答 1 投票 0

nvidia-docker 中的 TensorFlow:调用 cuInit 失败:CUDA_ERROR_UNKNOWN

我一直致力于让一个依赖 TensorFlow 的应用程序作为带有 nvidia-docker 的 docker 容器工作。我已经在 tensorflow/tensorflow:latest-g 之上编译了我的应用程序...

回答 4 投票 0

在多个 GPU 上训练模型非常慢

我想在一个节点的多个 GPU 上训练一个模型,但使用以下代码 策略 = tf.distribute.MirroredStrategy() print("设备数量:{}".format(strategy.num_replicas_in_sync)...

回答 1 投票 0

Tensorflow 找不到 GPU

图像显示了一切...我使用的是 Windows 11,CUDA v12.3 我已经更新了 NVIDIA 驱动程序,安装了 CUDA,并且我可以使用 nvidia-smi 通过命令行查看我的 GPU 我已将所有 cuDNN 文件放置在...

回答 1 投票 0

PyCuda中如何使用共享内存,LogicError: cuModuleLoadDataEx failed:遇到非法内存访问

我试图了解如何使用 PyCuda 处理共享内存。运行此代码来翻转输入向量: 将 pycuda.driver 导入为 drv 将 pycuda.gpuarray 导入为 gpuarray 导入 pycuda.autoini...

回答 1 投票 0

torch.cuda.is_avaiable 返回 False,nvidia-smi 不起作用

我正在尝试构建一个可以使用 GPU 运行的 docker 映像,这是我的情况: 我有 python 3.6,我从图像 nvidia/cuda:10.0-cudnn7-devel 开始。 Torch 没有看到我的 GPU。 Nvidia-SMI ...

回答 1 投票 0

Cuda 内核代码未涵盖所有图像

我正在尝试通过编写cuda内核代码来均衡直方图。主要问题是,在图像的某一行之前,操作似乎是正确的,之后输出是错误的,但我不能

回答 1 投票 0

在 Windows 10 上使用 VS Code 启用 GPU 进行 Python 编程 (llama-cpp-python)

在 Python 编程期间,我在使用 4GB Nvidia P100 GPU 的 32GB Windows 10 机器上启用 GPU 时遇到了很多困难。我的法学硕士在推理时没有使用我机器的 GPU。花了一些钱后...

回答 1 投票 0

这个 GPU 计算或着色器模式叫什么(如果有的话)?

首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...

回答 1 投票 0

想要安装peft并加速兼容torch 1.9.0+cu111

我想安装peft并加速: !pip install -q git+https://github.com/huggingface/peft.git !pip install -q git+https://github.com/huggingface/accelerate.git 但由于我的torch版本是1.9.0...

回答 1 投票 0

如何将 GPU 与张量流结合使用。

在 device_lib.list_local_devices() 中,列出了 GPU,但在 tf.config.list_physical_devices('GPU') 中没有列出。如何启用 GPU 的使用? 当我运行以下代码时 打印(device_lib.list_local_d...

回答 1 投票 0

在 Mac“Sonoma”上配置最大 GPU 内存

大型语言模型可以使用比允许的默认分数更多的 GPU 内存。在配备 M1 Max 和 32GB RAM 的 MacBook 上,我可以使用以下命令设置 GPU 内存使用上限

回答 1 投票 0

计算 FLOPS(每秒浮点运算次数)

如何计算应用程序的 FLOPS? 如果我有执行指令的总数,我可以将其除以执行时间。但是,如何统计执行的指令数呢? 我的

回答 3 投票 0

运行时错误:CUDA错误:没有内核映像可在具有3090 cuda11.3 torch10.1的设备上执行

您好,我尝试在 RTX 3090 上运行评估代码,但遇到以下问题: [13.73019 90.45654 -0.80213207 0.57002985] [12.367015 90.64196 1.0528708 0.56709075] ...

回答 1 投票 0

Numpy 会自动检测并使用 GPU 吗?

我有一些关于将 Numpy 与 GPU (nvidia GTX 1080 Ti) 一起使用的基本问题。我是 GPU 新手,想确保我正确使用 GPU 来加速 Numpy/Python。我在

回答 5 投票 0

JOCL CL_OUT_OF_RESOURCES 仅当已分配值时

我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...

回答 1 投票 0

我有一个两个 GPU 的 NVIDIA 驱动程序,在 ubuntu 上使用 python 代码显示它是一个 GPU ID

我有一个 2 A100 PCIE (80GB VRAM) GPU,但 NVIDIA 给我的可见 GPU 是 1。 例如 0 索引 GPU,我无法在 ubuntu 服务器上获取 1 索引 GPU。 这是代码结果 Pytorch 图像...

回答 1 投票 0

如何在Cupy内核中使用WMMA函数?

如何在cupy.RawKernel或cupy.RawModule中使用wmma::load_matrix_sync等WMMA函数? 有人可以提供一个最小的例子吗?

回答 1 投票 0

SLURM:Sinfo GresUsed

运行“sinfo ... --Format=GresUsed”等命令时如何解释 GresUsed 的输出格式 我的节点的输出看起来像这样: GPU:h100:0(IDX:不适用) 做什么...

回答 1 投票 0

如何使用ffmpeg API指定GPU?

据我所知,可以在命令行中使用-hwaccel_device或-gpu来指定GPU设备,但是如何在使用API时指定GPU呢? 我试图在 ffmpeg.c 中找到它,但这太复杂了......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.