sse 相关问题

SSE(Streaming SIMD Extensions)是许多类似命名的x86指令集向量扩展中的第一个。此时,SSE通常更常用于x86向量指令,而不是没有SSE2,SSE3等的SSE引用。

x86 内在函数:2 个复数浮点向量的乘积

我的输入是 2 个复数浮点向量。两个向量不交错: VecAReal = Are0, Are1, Are2,...Are[N-1] VecAImag = Aim0, Aim1, Aim2,...Aim[N-1] VecBReal = Bre0, Bre1, Bre2,...Bre[N-1] VecBI...

回答 0 投票 0

使用英特尔内在函数将 16 位向量 (__m128i) 拆分为奇数和偶数位置的 2 个向量

__m128i a = {1,2,3,4,5,6,7,8}; //8x16位 我想把这个寄存器分成 2 个向量,每个包含 4x32bit : __m128i x = {1,3,5,7} __m128i y = {2,4,6,8} 内部代码有可能吗? 在...

回答 0 投票 0

链接 VS2017 或 VS2019 库时,VS2022 可执行文件中超出范围的浮点到整数转换中断

我有一段代码存在于 VS2017 静态库中。在 2017 可执行文件中链接时,它按预期工作。但是,如果链接到 2022 可执行文件,它会中断 do...

回答 1 投票 0

_mm_comieq_ss Clang 和 GCC 的区别

我有一些 SIMD 代码检查变量之间的相等性,但是当涉及 NaN 时,我在 GCC 和 clang 之间得到不同的结果: 布尔等于(__m128 a,__m128 b){ 返回 _mm_comieq...

回答 1 投票 0

如何检测客户端何时在通过 apache 执行的 cgi 脚本(c++)中关闭 SSE(服务器端请求)? [关闭]

当客户端关闭 SSE(关闭浏览器)时,我的程序在调用 std::cout 时崩溃。 但是我无法检测到 cout 管道何时被破坏。 当我测试 std::cout.good() 它返回 true 即使...

回答 0 投票 0

SSE 遍历数组得到错误的值(两个双精度数组的点积)

我的汇编代码有问题:我需要将两个数组相乘,然后将结果相加并从中得到平方根。我已经完成了代码,看起来工作正常,但我需要收到 9....

回答 0 投票 0

将 YYmmdd_HHMMSS 时间戳转换为 uint64_t 数字的最快方法

#include #包括 #包括 #包括 #包括 #包括 #包括 #包括 #

回答 2 投票 0

带有 nestJs 的服务器发送事件(SSE)

我是 nestJs 的新手,现在我需要在 nestJs 中实现 sse,在 nestJs 中,他们有一个名为 @Sse 的特殊装饰器来建立客户端和服务器之间的 sse 连接。 如果我用这个...

回答 0 投票 0

如何在java中编写代码来接收text/event-stream事件流并一一打印?

我的需求是通过post发送请求调用API接口,然后将服务器返回的text/event-stream事件流一一打印出来,不管我是否使用HttpURLConnec...

回答 0 投票 0

我如何用 AVX512 本征收集单字节,给定一个 int 偏移量的向量?

我有一个基本地址 (uint8_t*) 和一个 16 个偏移量的向量 (__m512i)。我需要最终得到一个包含从16个不同的内存位置收集的16个字节的__m128i。就目前而言,我的理解是...

回答 1 投票 3

比较16字节字符串与SSE

我有16个字节的 "字符串"(它们可能更短,但你可以假设它们在结尾处用0填充),但你不能假设它们是16个字节对齐的(至少不总是)。如何编写一个...

回答 3 投票 2

关于连续迭代器的SIMD指令。

我有两个类型为T的向量v1和v2,想创建一个函数,使用SIMD指令执行v1 &v2,并将输出存储在一个向量out中。理想情况下,我们将得到的是first1 ...

回答 1 投票 2

将SSE与AVX128混合以使用较短的指令?

根据我收集到的所有信息,将SSE和128位(E)VEX编码的指令混合使用不会对性能造成任何影响。这表明可以将两者混合使用。这可能是...

回答 1 投票 1

如何在x86程序集中分割浮点数?

[当我尝试编写Heron算法以从ECX寄存器计算sqrt时,它不起作用。看起来问题在于除以浮点数,因为结果是整数。我的算法:sqrtecx:...

回答 3 投票 3

AVX2中的8位移位操作,移位为零

是否有任何方法可以在AVX2中重建_mm_slli_si128指令以将__mm256i寄存器移位x个字节? _mm256_slli_si256似乎只是在a [127:0]和a [255:128] .....

回答 2 投票 12

两个16位整数矢量与C ++中的AVX2的内积

我正在寻找最有效的方法来将两个对齐的int16_t数组相乘,其长度可以用AVX2除以16。在乘以一个向量x之后,我从...

回答 1 投票 0

如何在启用了SSE的情况下编译linux内核?

我处于以下情况:我正在向Linux内核添加基于浮点的算法。我知道我不应该这样做,但是我想尝试一下,看看它有多糟糕。 kernel_fpu_begin / ...

回答 1 投票 1

SSE2指令(例如orpd)的意义是什么?

orpd指令是“压缩双精度浮点值的按位逻辑或”。这是否与por(“按位逻辑或”)完全相同?如果是这样,那么具有...

回答 1 投票 1

SSE2指令(例如orpd)的意义是什么?

orpd指令是“压缩双精度浮点值的按位逻辑或”。这是否与por(“按位逻辑或”)完全相同?如果是这样,那么具有...

回答 1 投票 1

我如何有效地计时只有几个周期的函数的执行时间?

我正在尝试对使用SSE Intrinsics计算点积的不同方法进行一些比较,但是由于这些方法只有几个周期长,因此我必须运行数万亿个指令...]

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.