可以通过
movdqu
_mm_loadu_si128
通过 AVX512BW + AVX512VL 或 AVX512F + AVX512VL 提供
vmovdqu8
如果目的是掩码,那么为什么不掩码
_mm_loadu_epi8
暴露为内在函数?
_allow_cpu_features
https://godbolt.org/z/9aaha1h8r