AVX2指令延迟和吞吐量

问题描述 投票:5回答:1

我对以下内在函数/指令的性能属性感兴趣:

  • _mm256_andnot_si256 / vpandn
  • _mm256_and_si256 / vpand
  • _mm256_cmpgt_epi32 / vpcmpgtd
  • 和其他一些人。

但不幸的是,Intel Intrinsics Guide不包含那些内在函数/指令的延迟和吞吐量数字的表。我在哪里可以找到这些信息?

performance x86 x86-64 simd avx2
1个回答
7
投票

延迟和吞吐量数量的三个来源是:

InstlatX64列出了许多不同形式的指令(存储器和/或寄存器操作数,不同的操作数宽度等),但没有关于每个执行端口的μops数的信息。对于性能优化,不仅对延迟和吞吐量数量感兴趣,而且每个执行端口的这些μops非常相关。此信息由Agner Fog的指令表和uops.info提供。

© www.soinside.com 2019 - 2024. All rights reserved.