在cuda中,内核中有一个名为time()的函数,用于测试某些函数之间的延迟;例如,>
__global__ void kmulu_dep512() { start_time = clock(); repeat256(t *= t2 ; t2 *= t ; ) stop_time = clock(); }
我找不到OpenCL具有相似的功能,为了获得相似的效果,在OpenCL中是否有一些解决方法?
在cuda中,内核中有一个名为time()的函数,用于测试某些函数之间的延迟;例如,__global__ void kmulu_dep512(){start_time = clock(); repeat256(t * = t2; t2 * = t;)...
AFAIK,OpenCL中没有这样的内置功能,但是您可以通过主机API来实现:在OpenCL中查找有关事件分析信息的信息。