函数 - 本地lambda是如何有效地由C ++编译器内联的?

问题描述 投票:4回答:1

背景

作为一种组织策略,我喜欢在复杂的函数中定义函数本地lambda。它有利于封装多步逻辑,重复操作等(一般情况下功能的各种东西),但不会创建在使用它的范围之外可见的东西。它是John Carmack在他的essay on the merits of inlining code中展示的样式的一种综合/替代,因为它保留了所有在它打算使用的函数中整齐地装瓶的内容,同时还提供了(编译器识别的)名称来记录每个块的功能。一个简单的,人为的例子可能看起来像这样(只是假装实际上有一些复杂的东西可以在这里使用这种风格):

void printSomeNumbers(void)
{
  const auto printNumber = [](auto number) {
    std::cout << number << std::endl; // Non-trivial logic (maybe formatting) would go here
  };

  printNumber(1);
  printNumber(2.0);
}

从语义上讲,这个函数的编译形式是'假设'来创建一个隐式定义的仿函数的实例,然后在该仿函数上为每个提供的输入调用operator()(),因为这就是在C ++中使用lambda的意思。但是,在优化的构建中,as-if rule释放编译器以内联一些东西,这意味着实际生成的代码可能只是内联lambda的内容并完全跳过定义/实例化仿函数。在过去的讨论中,讨论了这种内联,herehere以及其他地方。

在我发现的所有lambda内联问题和答案中,所提出的示例没有使用任何形式的lambda capture,它们也主要涉及将lambda作为参数传递给某些东西(即在上下文中内联lambda)一个std::for_each电话)。那么我的问题是:编译器是否仍然可以内联一个捕获值的lambda?更具体地说(因为我假设各种变量的生命周期涉及到相当多的因素),编译器是否可以合理地内联一个lambda,它只在其定义的函数内使用,即使它捕获了一些东西(即局部变量)参考?

我的直觉是内联应该是可能的,因为编译器可以完全看到所有代码和相关变量(包括它们相对于lambda的生命周期),但我不是积极的,我的汇编阅读技巧不是'足以让自己得到可靠的答案。

附加示例

为了防止我所描述的特定用例不太清楚,这里是lambda的修改版本,它使用了我所描述的那种模式(同样,请忽略代码设计的事实)并且不必要地过于复杂):

void printSomeNumbers(void)
{
  std::ostringstream ss;
  const auto appendNumber = [&ss](auto number) {
    ss << number << std::endl; // Pretend this is something non-trivial
  };

  appendNumber(1);
  appendNumber(2.0);

  std::cout << ss.str();
}

我希望优化编译器应该有足够的信息来完全内联所有lambda用法,而不是在这里生成(或至少不保留)任何仿函数,即使它正在使用'应该'的引用捕获变量作为一些自动生成的闭包类型的成员处理。

c++ lambda c++17 compiler-optimization
1个回答
3
投票

是。

现代编译器使用“静态单一赋值”(SSA)作为优化过程。

每次分配值或修改它时,都会创建一个概念上不同的值。有时这些概念上不同的值共享标识(出于指针的目的)。

当你拿出某个东西的地址时,身份就会妨碍这一点。

简单引用转换为它们引用的值的别名;他们没有身份。这是引用的原始设计意图的一部分,以及为什么不能有指向引用的指针。

具体来说:

std::string printSomeNumbers(void)
{
  std::ostringstream ss;
  const auto appendNumber = [&ss](auto number) {
    ss << number << "\n"; // Pretend this is something non-trivial
  };

  printf("hello\n");
  appendNumber(1);
  printf("world\n");
  appendNumber(2.0);
  printf("today\n");

  return ss.str();
}

编译为:

printSomeNumbers[abi:cxx11]():           # @printSomeNumbers[abi:cxx11]()
        push    r14
        push    rbx
        sub     rsp, 376
        mov     r14, rdi
        mov     rbx, rsp
        mov     rdi, rbx
        mov     esi, 16
        call    std::__cxx11::basic_ostringstream<char, std::char_traits<char>, std::allocator<char> >::basic_ostringstream(std::_Ios_Openmode)
        mov     edi, offset .Lstr
        call    puts
        mov     rdi, rbx
        mov     esi, 1
        call    std::basic_ostream<char, std::char_traits<char> >::operator<<(int)
        mov     esi, offset .L.str.3
        mov     edx, 1
        mov     rdi, rax
        call    std::basic_ostream<char, std::char_traits<char> >& std::__ostream_insert<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*, long)
        mov     edi, offset .Lstr.8
        call    puts
        mov     rdi, rsp
        movsd   xmm0, qword ptr [rip + .LCPI0_0] # xmm0 = mem[0],zero
        call    std::basic_ostream<char, std::char_traits<char> >& std::basic_ostream<char, std::char_traits<char> >::_M_insert<double>(double)
        mov     esi, offset .L.str.3
        mov     edx, 1
        mov     rdi, rax
        call    std::basic_ostream<char, std::char_traits<char> >& std::__ostream_insert<char, std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*, long)
        mov     edi, offset .Lstr.9
        call    puts
        lea     rsi, [rsp + 8]
        mov     rdi, r14
        call    std::__cxx11::basic_stringbuf<char, std::char_traits<char>, std::allocator<char> >::str() const
        mov     rax, qword ptr [rip + VTT for std::__cxx11::basic_ostringstream<char, std::char_traits<char>, std::allocator<char> >]
        mov     qword ptr [rsp], rax
        mov     rcx, qword ptr [rip + VTT for std::__cxx11::basic_ostringstream<char, std::char_traits<char>, std::allocator<char> >+24]
        mov     rax, qword ptr [rax - 24]
        mov     qword ptr [rsp + rax], rcx
        mov     qword ptr [rsp + 8], offset vtable for std::__cxx11::basic_stringbuf<char, std::char_traits<char>, std::allocator<char> >+16
        mov     rdi, qword ptr [rsp + 80]
        lea     rax, [rsp + 96]
        cmp     rdi, rax
        je      .LBB0_7
        call    operator delete(void*)
.LBB0_7:
        mov     qword ptr [rsp + 8], offset vtable for std::basic_streambuf<char, std::char_traits<char> >+16
        lea     rdi, [rsp + 64]
        call    std::locale::~locale() [complete object destructor]
        lea     rdi, [rsp + 112]
        call    std::ios_base::~ios_base() [base object destructor]
        mov     rax, r14
        add     rsp, 376
        pop     rbx
        pop     r14
        ret

Godbolt

请注意,在printf调用之间(在汇编中它们是puts)除了直接对operator<<ostringstream之外没有其他调用。

© www.soinside.com 2019 - 2024. All rights reserved.