假设,我被告知创建一个配置的 CUDA 内核
SIZE_1 x SIZE_2
。
是这个意思吗
dim3 block_size(SIZE_1, SIZE_1);
dim3 grid_size(SIZE_2, SIZE_2);
或者,这意味着
dim3 block_size(SIZE_1, SIZE_2);
dim3 grid_size((N + SIZE_1 - 1) / SIZE_1, (N + SIZE_2 - 1) / SIZE_2);
或者,其他的东西
??
请解释原因。