micro-optimization 相关问题

微优化是对小部分代码进行细致调整的过程,以解决其操作的某些方面(内存使用过多,性能不佳等)的感知缺陷。

具有多次收益时对业绩的影响

看看下面的情况。 ;一些代码测试reg1,reg2 je jump1;做一些添加rsp,20 pop rdx ret jump1:;做一些cmp reg2,reg3 jg jump2添加一些rsp,20 pop rdx ret jump2:;做...

回答 1 投票 0

使用Vector从2个数组中添加整数 比传统的for循环需要更长的时间

我正在尝试使用Vector来比传统的for循环更快地从2个数组中添加整数值。我的Vector计数是:4,这意味着addArrays_Vector函数应运行约4次...

回答 1 投票 0

大型数组或列表的4桶直方图的微优化

我有一个特殊问题。我将尽力描述这一点。我正在做一个非常重要的“微优化”。一次运行几天的循环。因此,如果我可以缩短循环时间...

回答 1 投票 0

一个简单的for循环的微观优化

我有一个特殊问题。我将尽力描述这一点。我正在做一个非常重要的“微优化”。一次运行几天的循环。因此,如果我可以缩短循环时间...

回答 1 投票 0

80286:乘以10最快的方法是什么?

将数字乘以2的任意倍数,我将其移位多次。有没有这样的技术可以在更少的周期内将数字乘以10?

回答 1 投票 1

性能损失:归一化数字与分支错误预测

对于已经测量过此类知识或对此类注意事项有深入了解的人,假定您必须执行以下操作(为示例选择任何一种):浮点运算符:...

回答 1 投票 1

将XMM寄存器设置为重复字节模式(广播一个恒定字节)

[我知道我们可以执行以下操作将字符移动到xmm寄存器:movaps xmm1,xword [.__ 0x20]对齐16 .__ 0x20 db 0x20,0x20,0x20,0x20,0x20,0x20,0x20,0x20,0x20 ,0x20,0x20,0x20,0x20,...

回答 1 投票 0

sse2将字符移动到xmm,并重复到结尾

我知道我们可以执行以下操作将字符移动到xmm寄存器:movaps xmm1,xword [.__ 0x20]对齐16 .__ 0x20 db 0x20,0x20,0x20,0x20,0x20,0x20,0x20,0x20,0x20 ,0x20,0x20,0x20,0x20,...

回答 1 投票 0

我的类的实例使用多少字节? [重复]

构造函数调用后,下一个类的实例有多大?我想这通常可以写成size = nx + c,其中x =在x86中为4,而x =在x64中为8。 n =? c =? ....

回答 1 投票 1

如何在比较函数中优化多个独立条件分支?

struct Obj {int x;诠释int z; }; int Compare(Obj * a,Obj * b){如果(a-> x> b-> x)返回1;否则(a-> x x)返回-1;如果(a-> y> b-> y)返回1; ...

回答 2 投票 3

类成员的顺序会影响访问速度吗?

我正在编写一个绝对没有开销的委托库。因此,重要的是尽快完成对函数指针的访问。所以我的问题是:...

回答 1 投票 1

用内在函数初始化__m128i常数的最快方法?

[当前,我有一个__m128i变量,我们将其称为X。我想将其与一个恒定的128bit值进行异或,然后将该值保存回X。因此,对于某些恒定的C,基本上是X ^ =C。我是...

回答 1 投票 0

用内在函数初始化__m128i的最快方法?

[当前,我有一个__m128i变量,我们将其称为X。我想将其与一个恒定的128bit值进行异或,然后将该值保存回X。因此,对于某些恒定的C,基本上是X ^ =C。我是...

回答 1 投票 0

如何使用最少的指令数复制寄存器并执行`x * 4 + constant`

我是x86汇编的新手。例如,以下指令:将ESP的内容乘以4,然后加上0x11233344,并将结果存储在EDI中。我如何在x86中表示此指令...

回答 1 投票 -1

“ pcmpeqb”的等待时间-内存与xmm寄存器的关系

我有这2个选项:选项1:循环:... movdqu xmm0,[rax] pcmpeqb xmm0,[.zero_table] ... ...对齐16 .zero_table:DQ 0,0选项2:pxor xmm1, xmm1循环:... movdqu ...

回答 1 投票 0

微优化:从函数结尾处的内部块返回

在诸如javascript或lua之类的语言中,默认情况下,所有函数都被视为末尾有return语句:function(){//做return; }等于function(){//做} ...

回答 2 投票 0


Python中索引运算符的快速方式(lambda i:l [i])

给出一个可索引的数据结构,例如列表l,我们如何获得与(lambda i:l [i])等效的最快函数? lambda函数的问题在于它是Python,并且会降低...

回答 2 投票 1


为JavaScript中的for循环传递,传递,映射,过滤和传递到长度

我有一个WebGL项目,每个微优化都很重要。为了提高可读性,我使用.forEach,.map,.filter和for循环,但是我想基于...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.