avx2 相关问题

在Xcode（版本10.1（10B61））中，我使用如下的Macro来检测AVX512支持。 #ifdef __SSE4_1__ #error“sse4_1”＃endif #ifdef __AVX__ #error“avx”#endif #ifdef __AVX2__ #error“avx2”#endif＃...

xcode clang avx avx2 avx512

回答 1 投票 1

相同的AVX2程序在gcc和msvc中产生不同的结果

我正在尝试使用AVX2增加md5哈希的吞吐量。我使用了github用户提供的simd_md5库。在msvc2013上，我获得了所有8个缓冲区的所需结果，但是当我运行相同时在linux上...

c++ c visual-studio-2012 avx2 gcc7

回答 1 投票 1

AVX2指令延迟和吞吐量

我对以下内在函数/指令的性能属性感兴趣：_mm256_andnot_si256 / vpandn _mm256_and_si256 / vpand _mm256_cmpgt_epi32 / vpcmpgtd和其他一些。但......

performance x86 x86-64 simd avx2

回答 1 投票 5

AVX512中是否有像_mm512_sign_epi16（__ m512i a，__ m512i b）的功能

以下功能似乎在AVX512上不可用：__ m512i _mm512_sign_epi16（__ m512i a，__ m512i b）它可以很快就可用还是有替代品？

simd intrinsics instruction-set avx2 avx512

回答 2 投票 4

在CPU中禁用AVX2以进行测试

我有一个需要AVX2正常工作的应用程序。如果CPU具有AVX2指令，则执行检查以在应用程序启动期间进行检查。我想检查它是否正常工作，但我......

testing x86 avx instruction-set avx2

回答 1 投票 8

AVX2：分配给__m256i类成员时出现分段错误

我目前正在重构一个命令式的C ++程序，该程序将AVX2原语广泛用于结构良好的基于类的程序。不幸的是，我在分配课程时遇到了段错误......

c++ segmentation-fault memory-alignment avx avx2

回答 1 投票 1

如何有效地重新排序__m256i向量的字节（将int32_t转换为uint8_t）？

我需要优化以下压缩操作（在具有AVX2指令的服务器上）：取浮点数组的指数，移位并存储到uint8_t数组我几乎没有...

c++ vectorization simd intrinsics avx2

回答 1 投票 1

当我测试模块的循环次数时，每次测试的结果都是完全不同的。

当我测试模块的循环次数时，每次测试的结果都大不相同？1781344 - >第一次测试1264558 - >第二次测试1388058 - >第三次测试我用__rdtsc（）来记录周期，...

benchmarking intel avx2 avx512 rdtsc

回答 1 投票 0

AVX2转置由8x __m256i寄存器表示的矩阵

我试图找出如何转换（在AVX2内在函数中）由8行__m256i寄存器组成的矩形矩阵，每个寄存器包含32x 8位（char）。 __m256i矩阵[8]; // 32x8bit整数...

c x86 transpose simd avx2

回答 1 投票 4

将8个字符从内存加载到__m256变量中作为压缩单精度浮点数

我正在优化图像上的高斯模糊算法，我想用下面的代码替换__m256内部变量中浮点缓冲区[8]的用法。什么系列的指令是最好的......

c++ sse simd avx avx2

回答 1 投票 5

如何将32位浮点数转换为8位有符号字符？

我想要做的是：将输入浮点数乘以固定因子。将它们转换为8位有符号字符。请注意，大多数输入具有较小的绝对值范围，如[-6,6]，...

c x86 simd intrinsics avx2

回答 2 投票 3

编译AVX2程序

我用AVX内在函数编写了一个程序，它使用Ubuntu 12.4 LTS和GCC 4.6以及以下编译行很好地工作：g ++ -g -Wall -mavx ProgramName.cc -o ProgramName问题...

c gcc avx avx2

回答 2 投票 1

avx2 相关问题

最新问题