在 AVX512 寄存器中生成 0、1、2、...、7 序列的有效方法?

问题描述 投票:0回答:0

在 AVX512 寄存器中加载算术序列 [0、1、2、3、4、5、6、7](

uint64_t
值)的最有效方法是什么?

一个明显的解决方案是使用

_mm512_load_epi64()
从内存中加载序列,但是大多数加载的字节都是零,所以我怀疑应该有更有效的解决方案来动态生成这个序列而不会有缓存未命中的风险。

intel intrinsics avx512
© www.soinside.com 2019 - 2024. All rights reserved.