C ++编译器是否会使用少量术语内联for循环？

Question

假设我有一个类Matrix5x5（有适当重载的索引运算符），我编写了一个方法trace来计算其对角元素的总和：

double Matrix5x5::trace(void){
    double t(0.0);
    for(int i(0); i <= 4; ++i){
        t += (*this)[i][i];
    }
    return t;
}

当然，如果我改为写道：

return (*this)[0][0]+(*this)[1][1]+(*this)[2][2]+(*this)[3][3]+(*this)[4][4];

然后我肯定会避免声明和增加我的i变量的开销。但是写出所有这些条款感觉非常愚蠢！

由于我的循环有一个恰好很小的constexpr项，所以编译器会为我内联吗？

Answer 1

是! GCC在优化级别-O1及以上进行，并且clang在优化级别-O2及以上进行。

我用这段代码测试了它：

struct Matrix5x5 {
    double values[5][5];
    Matrix5x5() : values() {}

    double trace() {
        double sum = 0.0;
        for(int i = 0; i < 5; i++) {
            sum += values[i][i]; 
        }
        return sum; 
    }
};

double trace_of(Matrix5x5& m) {
    return m.trace(); 
}

这是由gcc和clang制作的组件：

trace_of(Matrix5x5&):
    pxor    xmm0, xmm0
    addsd   xmm0, QWORD PTR [rdi]
    addsd   xmm0, QWORD PTR [rdi+48]
    addsd   xmm0, QWORD PTR [rdi+96]
    addsd   xmm0, QWORD PTR [rdi+144]
    addsd   xmm0, QWORD PTR [rdi+192]
    ret

您可以使用代码，并在此处查看相应的程序集：https://godbolt.org/z/p2uF0E。

如果你重载operator[]，那么你必须将优化级别提升到-O3，但编译器仍然会这样做：https://godbolt.org/z/JInIME

Answer 2

如果您的编译器足够聪明，它可以使用as-if rule优化这种情况。 C ++编译器可能会以这种方式优化很多东西。但它也可能没有。绝对确定的唯一方法是检查特定编译器生成的代码。话虽如此，这不太可能成为您计划的瓶颈。那么哪个版本更具可读性。

C ++编译器是否会使用少量术语内联for循环？

问题描述投票：-2回答：2

2个回答

最新问题

C ++编译器是否会使用少量术语内联for循环？

问题描述 投票：-2回答：2

2个回答

最新问题

问题描述投票：-2回答：2