x86-64 相关问题

x86-64是Intel x86架构的64位扩展

如何更改buildroot的键盘布局?

在使用 qemu 启动图像时,我正在尝试将键盘布局(即我们的键盘布局)更改为西班牙语。 我是否应该更改输出文件夹中的某些内容,或者配置 IM 时是否有选项...

回答 1 投票 0

x86_64 在长模式 64 位子模式下运行

我想询问 x86_64 处理器如何知道它处于 IA-32e 64 位子模式。 据我所知,EFER MSR(0xC0000080)内的LM位必须设置。此外,当前的 L 位...

回答 1 投票 0

使用 SSE 进行打包 16 元素混合的最佳方法

我想使用SSE实现以下功能。它将 a 中的元素与 b 中的打包元素混合在一起,其中元素仅在使用时才出现。 无效的packedBlend16(uint8_t掩码,

回答 1 投票 0

有什么想法导致这种奇怪的性能下降似乎取决于寄存器的选择吗?

我一直在尝试进一步优化这个展开的循环: 一些_循环: 展开_CNT = 256 ;至少最适合 Core i9-9900k 展开_I = 0 重复 UNROLL_CNT ; ; 1号座 ...

回答 1 投票 0

64 位 Web 应用程序中 Sage 100c 的 32 位库

我的 VS2022 中有一个现有的 Web 应用程序项目。 我为 Sage 100c(object métier)上的所有连接创建了一个名为“Sage”的库。但这个必须是32位的。我设定了目标...

回答 1 投票 0

Bug:等效向量内部代码 c

目前我有一段 C 代码,它是用 Intel 内在函数编写的,它使用 AVX512BW + AVX512VL 和 SSE 指令。 尝试加载 16 字节数据的地方 __m128i 输入 16 =

回答 1 投票 0

使用 Rust SSE 内在函数进行浮点乘法没有加速

我正在尝试使用 Rust 中的内在函数进行实验,其中我制作了一个大的浮点数向量,然后记录将它们全部乘以一个常数所需的时间。接下来我用 SSE intrin 尝试同样的事情...

回答 1 投票 0

优化SIMD版本的范围生成算法

在我的一个 C 项目中,我想快速生成具有起点、增量值和终点的双精度浮点数的一维向量。很重要...

回答 1 投票 0

二元炸弹实验室作业第 5 阶段 - 卡在 XOR 线上

在我的炸弹实验室的第五阶段,我需要输入七个整数。 这是我所坚持的部分的汇编代码: 0x00005555555568cc <+11>: 异或 0x8(%rsp),%esi 0x00005555555568d0 <+15>...

回答 1 投票 0

64 位的 x86 汇编,从函数返回字符串并将其放入数组中

我使用 64 位程序集并有两个不同的文件。其中一个文件更改了字符串,以便该字符串添加了随机的新字符。另一个文件包含一个数组。 这是来自...

回答 1 投票 0

汇编 x86 64 位,从函数返回字符串并将其放入数组

我使用 86 位程序集并有两个不同的文件。其中一个文件更改了字符串,以便该字符串添加了随机的新字符。另一个文件包含一个数组 这是来自文件

回答 1 投票 0

x86 AVX 中有聚合操作吗?

我正在尝试编写一个简单的游戏,我需要研究一些用于向量运算的x86汇编。使用xmm作为4压缩单精度浮点,是否有聚合运算?例如: “……

回答 1 投票 0

在程序集 x86_64 中跳转后调用 ret 时出现分段错误

我是汇编 x86_64 的新手,正在尝试学习跳转条件。 在我的代码中,当我使用“jump if equal”调用时,出现分段错误, 但是如果我调用该函数然后返回就没有错误,为什么......

回答 1 投票 0

汇编英特尔64字节,打印循环

当我想循环打印时遇到问题。我的想法是打印元素,在这种情况下,是集合的差异。但是当它打印第一个元素时,它会离开循环和原理......

回答 1 投票 0

PCI 和 PCIe 是否允许更改 BAR 值以将设备寄存器重新映射到新地址?

(为我之前的问题道歉,我的内核中的代码错误导致BAR的“所需映射空间”值错误,并且误导了我写了错误的问题描述。) 我很困...

回答 1 投票 0

令人困惑的 clang 斐波那契拆解

我无法理解这是怎么回事: int fib_iter(int num) { 整数a=1; 整数 b = 1; 整数c=0; 对于 (int i = 0; i < num; i++) { c = a; b += a; a = c; }

回答 1 投票 0

在 OpenWrt 上的 CentOS 7 容器中运行 32 位程序:排除 Steamcmd 问题

我正在 OpenWrt 上的 Docker 内运行 CentOS 7 容器,其内核版本如下:Linux iStoreOS 5.10.176 #0 SMP Tue Jul 25 05:14:16 2023 x86_64 GNU/Linux。然而,无论我做什么...

回答 1 投票 0

为什么对齐访问和非对齐访问具有相同的性能?

来自 Intel CPU 手册(Intel® 64 和 IA-32 架构软件开发人员手册第 3 卷(3A、3B、3C 和 3D):系统编程指南 8.1.1),它说“非对齐数据访问将串行...

回答 1 投票 0

INTEL X86,为什么对齐访问和非对齐访问性能相同?

来自 INTEL CPU 手册(Intel® 64 和 IA-32 架构软件开发人员手册第 3 卷(3A、3B、3C 和 3D):系统编程指南 8.1.1),它说“非对齐数据访问将严重...

回答 1 投票 0

X86 上,load(memory_order_seq_cst) 或atomic_fetch_add(0, memory_order_relaxed) 哪一个性能更好?

问题1:我有一个主要用于计数的变量,只关心它自己的值。以下两种方法哪一种性能更好? 方法一: 阅读:aaa.atomic_fetch_add(0,

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.