我想同时执行 kernel_A
在多个cuda_streams。
所以我在下面的链接中找到了参考代码(https:/devblogs.nvidia.comgpu-pro-tip-cuda-7-streams-simplify-concurrency-------------。)似乎只适用于 linux 与某些编译选项。
但我不确定 "并发cuda_stream "是否可以在使用 windows10 64bit, 视觉工作室2017, CUDA v10.2, RTX 2070(这是我的设置)。另外,我无法启动 nvvp
遇到了一些问题,使我不能用时间轴监控状态。
visual studio 2017
关于 windows 10? (在windows上看起来不可能,但在linux上是可以的。) 如何在Visual Studio 2013中启用CUDA 7.0+每线程默认流?)