如何使用per-thread和cuda流并发运行内核?

问题描述 投票:0回答:0

我想同时执行 kernel_A 在多个cuda_streams。

所以我在下面的链接中找到了参考代码(https:/devblogs.nvidia.comgpu-pro-tip-cuda-7-streams-simplify-concurrency-------------。)似乎只适用于 linux 与某些编译选项。

但我不确定 "并发cuda_stream "是否可以在使用 windows10 64bit, 视觉工作室2017, CUDA v10.2, RTX 2070(这是我的设置)。另外,我无法启动 nvvp 遇到了一些问题,使我不能用时间轴监控状态。

  1. 在windows上可以使用并发内核执行吗?
  2. 如何用特定的选项在 visual studio 2017 关于 windows 10? (在windows上看起来不可能,但在linux上是可以的。) 如何在Visual Studio 2013中启用CUDA 7.0+每线程默认流?)
cuda visual-studio-2017 cuda-streams
© www.soinside.com 2019 - 2024. All rights reserved.