sse 相关问题

SSE(Streaming SIMD Extensions)是许多类似命名的x86指令集向量扩展中的第一个。此时,SSE通常更常用于x86向量指令,而不是没有SSE2,SSE3等的SSE引用。

为什么使用 AVX ymm(m256) 指令比 xmm(m128) 慢约 4 倍

我编写了将arr1*arr2相乘并将结果保存到arr3的程序。 伪代码: arr3[i]=arr1[i]*arr2[i] 我想使用 AVX 指令。我有 m128 和 m256 指令的汇编代码(

回答 1 投票 0

SSE加载和添加

假设我有两个向量,由两个 double 类型的数组表示,每个数组的大小为 2。我想添加相应的位置。所以假设向量 i0 和 i1,我想添加 i0[0] + i1[0] 和 i0[1] + i...

回答 2 投票 0

SSE 矢量与 Epsilon 的比较

我正在编写需要比较两个 _mm256 向量是否相等的软件。但是,我希望误差范围为 +/- 0.00001。例如,3.00001 应被视为等于 3.00002。难道是……

回答 1 投票 0

AVX 中缺少字节粒度屏蔽存储

我正在将代码从 SSE 迁移到 AVX。该代码使用_mm_maskmoveu_si128,它根据掩码有条件地存储16个字节。 AVX 等效项是 32 字节的 _mm256_maskmoveu_si256,但是这个

回答 1 投票 0

AVX 缺少蒙面商店

我正在将代码从 SSE 迁移到 AVX。该代码使用_mm_maskmoveu_si128,它根据掩码有条件地存储16个字节。 AVX 等效项是 32 字节的 _mm256_maskmoveu_si256,但是这个

回答 1 投票 0

x86指令PCLMULQDQ中的“P”前缀代表什么?

在无进位乘法x86指令PCLMULQDQ中,“P”前缀代表什么? 我查看了这些来源,但没有一个解释助记符。 https://www.intel.com/

回答 1 投票 0

Qt Creator 中的 SIMD 指令

我正在与一家公司合作创建一组使用 SSE 指令的专门代码。他们正在使用 Qt Creator IDE。我已经为他们提供了一个 C 头文件和相应的 *.c 文件...

回答 1 投票 0

上交所内在函数atan2

我需要一个非常快的atan2来从sobel值中获取梯度(我正在实现精明的边缘算法。)。有谁知道一个非常快速的实现,最好是内在函数(SIMD)或非常......

回答 2 投票 0

C simd _m128 晶圆厂

如何为 __m128 向量制作 fabs() ? 我是否必须使用符号位将原始向量乘以 1.0f/-1.0f ? 没有找到任何指令集来做到这一点。 我不想要 __m256 或 512。我正在搜索...

回答 2 投票 0

x86 汇编 如何正确地将 xmm0 放入 st0?

大家度过了美好的周日。 我目前正在32位环境(当前是Windows)中学习很多汇编。 我为此使用 FASM。 我有以下我成功制作的代码,但我很

回答 1 投票 0

Python;对象未定义错误,我以为我定义了它

我是Python新手,找不到可行的解决方案,因此我向你寻求帮助 这是我的代码: 导入请求 导入 json 导入sseclient API_KEY = '因原因隐藏' 定义

回答 1 投票 0

服务器使用 nghttp2 发送事件(SSE)

是否可以使用 nghttp2-Library 创建/提交服务器发送的事件。 到目前为止,我们还没有成功编写一个示例服务器应用程序,该应用程序响应“订阅”每个...

回答 0 投票 0

如何在Delphi XE3中使用align-data-move SSE?

我试图运行以下命令, 类型 向量 = Single 的数组 [1..4]; {$代码对齐16} 函数add4(const a,b:向量):向量;登记;汇编器; 汇编 movaps xmm0, [a] movaps xmm1,[b...

回答 4 投票 0

高效(在 Ryzen 上)将 __m256 的奇数元素提取到 __m128 中的方法?

是否有一种固有的或另一种有效的方法将 AVX 寄存器的 64 位组件的高/低 32 位组件重新打包到 SSE 寄存器中?使用 AVX2 的解决方案是可以的。 到目前为止,我正在使用

回答 1 投票 0

如何使用SIMD检查奇数车道是否在给定范围内,当其先前的偶数车道等于某个值时?

这个问题是 How to check if even/odd lane are in given ranges using SIMD? 的扩展。 给定一个存储 16 个字符的 __m128i,偶数索引通道指的是偶数通道(即通道在 0、2、...

回答 0 投票 0

如何使用 SIMD 检查偶数/奇数车道是否在给定范围内?

给定一个存储 16 个字符的 __m128i,偶数索引通道指偶数通道(即 0、2、4、...、14 处的通道),奇数索引通道指奇数通道(即,车道在 1、3、5、... 15)。 在我的申请中...

回答 1 投票 0

EventSource 在本地工作,但在 Heroku 上部署时无法接收数据

我们有一个带有 ExpressJS 服务器的 Nuxt 项目,它使用 EventSource 从服务器获取流数据。这在本地主机上工作得很好,但是当部署在 Heroku 上时,没有收到任何数据,而且

回答 0 投票 0

XMM寄存器0未被使用

在 Intel x64 手册中它说在 32 位 SSE2 模式下有 XMM 寄存器 0-7。那么为什么使用这些寄存器的指令中有 95% 会跳过 0 而使用 1-4?

回答 2 投票 0

SIMD 加法指令(任何算术运算)

给定两个任意大小的数组 n 我们要添加(或任何算术运算,如乘法)。 arr = [1,2,3,4,5,6,7,8] brr = [1,2,3,4,5,6,7,8] 我试过给定的代码,但它没有给出正确的输出...

回答 0 投票 0

当 asm 写入/读取数据距离堆栈指针太远时,Valgrind 报告错误

美好的一天! 我正在使用 Xbyak 在 C++ 中编写 JIT asm 生成。 这个问题出现在序言和结语中。 我在序言中做的最后一件事是将 Xmms 值写入堆栈。在此之后我不...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.