就SIMD和并行化而言,AVX2和AVX-512有什么区别?他们是同一件事还是不同?我只看到在AVX-512中使用了double8,在AVX2中使用了double4?
我正在使用PyOpenCL用C编写内核代码,但不确定会有什么区别。
AVX2仅是256位向量指令。 AVX1仅支持浮点运算,AVX2添加256位整数运算。 AVX-512是一组512位向量指令。只有两种口味的AVX:普通的旧式AVX和AVX2。 AVX-512具有许多不同的口味。您可能会发现Intel's Intrinsics Guide很有趣。