intel 相关问题

有关英特尔半导体芯片和组件,英特尔架构特性和ISA扩展以及英特尔芯片微架构的相关问题。

我应该如何使用Intel的文档获得与x86中的call dword ptr指令相对应的ModeR / M字节?

我在VS2017中调试了以下代码(请注意下面的断点):在下面您会发现上面提到的断点的反汇编:如上图所示,机器代码...

回答 1 投票 2

SIMD:更通用的随机播放功能

我认为对于int32_t,SIMD混洗功能不是真正的混洗,在这种情况下,左右部分将分别进行混洗。我想要一个真正的随机播放功能,如下所示:假定我们有__m256i和...

回答 1 投票 0

Skylake是否需要vzeroupper来使turbo时钟恢复到仅读取ZMM寄存器并写入k掩码的512位指令后恢复?

写入ZMM寄存器可以使Skylake-X(或类似的)CPU无限期地处于最大涡流降低的状态。 (SIMD指令可降低CPU频率并动态确定恶意AVX-512 ...

回答 1 投票 5

尝试使用'aocl install'安装de5a_net_i2驱动程序,但失败

我正在尝试安装DE5-NET FPGA的驱动程序。我在Ubuntu 16.04上使用针对OpenCL 16.0的英特尔FPGA SDK。 aoc --list-boards提供输出de5a_net_e1但是,在此步骤之后,当我尝试...

回答 1 投票 0

通过C中的链接库对函数进行并行计算

我是并行计算和寻找选项和技巧的新手。 我现在的问题是找到 个 B AX类型的独立线性方程 其中A x ,B x 和X x 的尺寸 A是密集矩阵。 我在Inte...

回答 2 投票 2

FP和整数除法是否在x86 CPU上争夺相同的吞吐量资源?

[我们知道Intel CPU在端口0上未完全流水线的除法执行单元上执行整数除法和FP div / sqrt。我们从IACA输出,其他已发布的内容和实验测试中了解到这一点。 ...

回答 1 投票 3

现代英特尔处理器有多少种超标量的方法?

我刚刚了解了超标量处理器(https://en.wikipedia.org/wiki/Superscalar_processor)。我还了解到,随着超标量处理器宽度/方式数量的增加,事情会变得更多...

回答 1 投票 2

CLWB(高速缓存行回写)到同一位置的性能较低,而循环通过几行

为什么当我增加kNumCacheLines时,下面代码的运行时间减少?在每次迭代中,该代码都会修改kNumCacheLines个缓存行之一,并使用clwb ...

回答 1 投票 4

Debian 10(Buster)缓慢的桌面/ GUI

安装Debian 10(Buster)时,桌面/ GUI应用程序运行缓慢。打开应用程序(例如Firefox,Terminal等)需要很长时间,并且系统根本无法使用。 apt update && ...

回答 1 投票 0


当Fortran库中的C ++可执行文件链接到C ++库中的main时,链接器错误

我有一个基于CMake的项目,包括三个目标:用Fortran编写的静态库FortLib。静态库LibWithMain,用C ++编写,包含int main()的定义。 ...

回答 1 投票 3

对于将Intel Optane DC SSD用作IMDT作为额外的RAM感到困惑?

我对Intel Optane DC感到有些困惑。我希望我的Optane DC能够兼做DRAM和存储。一方面,我了解到只有“ Intel Optane DC永久内存...

回答 1 投票 0

Intel MKL和Oracle R发行版

我正在尝试测试使用Oracle R Distribution的多线程优势。我有一个工作站,它具有12核CPU和32 GB可用的RAM,我非常想利用它。我已经下载了...

回答 1 投票 2

无法加载DLL'iaStorAfsServiceApi.dll':找不到分隔的模块

解决方案-适用于我的解决方案----转到控制面板->程序和功能->右键单击Intel Optane Pinning Explorer Extensions->单击修复。成功的过程之后.....

回答 1 投票 0

为什么当另一个进程共享相同的HT内核时,一个进程的执行时间更短

我有一个带有4个HT内核(8个逻辑CPU)的Intel CPU,我构建了两个简单的进程。第一个:int main(){for(int i = 0; i <1000000; ++ i)for(int j = 0; j <100000; ++ j); }第二个:...

回答 1 投票 3

用于单核的英特尔编译器标志

我注意到在我看来,大多数包含矩阵/矩阵和矩阵/矢量乘法的fortran代码都有令人惊讶的行为。最初,代码是使用gfortran和...

回答 1 投票 0

性能三角洲造成指针赋值或增量(严格走样?)

更新:小例子,证明在锵7.0的问题 - https://wandbox.org/permlink/G5NFe8ooSKg29ZuS https://godbolt.org/z/PEWiRk我遇到的一个功能的性能的变化...

回答 1 投票 -1

英特尔CPU上的OpenCL管道

我对我的论文项目的工作试图调查是否以及何时使用OpenCL的管道可以在CPU上也很有用(我们已经知道他们被广泛应用于FPGA)的。我想实现...

回答 1 投票 5

PUSH的英特尔REX编码

GAS提供了以下编码以下说明:推RBP#0x55的推RBX#0x53推R12#的0x41 0x54推R13#的0x41 0x55的从AMD64规范(页313):PUSH REG64 ...

回答 1 投票 5

如何使用SIMD计算字符出现

我给定的小写字符一个阵列(最多为1.5Gb)和字符c。我想找到多少次的字符c使用AVX指令。无符号长长char_count_AVX2(...

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.