为什么这个LLVM IR代码会产生意想不到的结果？

Question

我真的很沮丧，因为这个问题已经困扰了我好几天，所以我很感激每一个可能的帮助。

我目前正在编写自己的编程语言，目前我正在尝试实现枚举和匹配语句，这些语句将值与枚举情况相匹配并运行相应的语句，但我会在这里和那里得到意想不到的结果和段错误。

这是我的语言的一段代码运行（lli）但有时会产生意外的结果（由于某种原因打印1，而不是3）：

class Node {
    fld value: int;
    fld next: OptionalNode;

    new(_value: int, _next: OptionalNode) {
        value = _value;
        next = _next;
    }
}

enum OptionalNode {
    val nil;
    val some(Node);
}

fun main(): int {
    var s: OptionalNode = OptionalNode.some(new Node(3, OptionalNode.nil));

    match s {
        OptionalNode.some(n) => print n.value;
    }

    var r: int = 0;

    ret r;
}

这是我的编译器生成的相应LLVM IR：

; ModuleID = 'test.bc'
source_filename = "test"

%test.Node = type { i32, %test.OptionalNode }
%test.OptionalNode = type { i8, [8 x i8] }
%test.OptionalNode.nil = type { i8 }
%test.OptionalNode.some = type { i8, %test.Node* }

@str = private unnamed_addr constant [4 x i8] c"%d\0A\00", align 1

declare i32 @printf(i8*, ...)

define void @"test.Node.!ctor$[test.Node]i[test.OptionalNode]"(%test.Node* %this, i32 %_value, %test.OptionalNode %_next) {
entry:
  %arg0 = alloca %test.Node*, align 8
  store %test.Node* %this, %test.Node** %arg0
  %arg1 = alloca i32, align 4
  store i32 %_value, i32* %arg1
  %arg2 = alloca %test.OptionalNode, align 16
  store %test.OptionalNode %_next, %test.OptionalNode* %arg2
  %ldarg1 = load i32, i32* %arg1
  %tmpld_cls = load %test.Node*, %test.Node** %arg0
  %tmpfld = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls, i32 0, i32 0
  store i32 %ldarg1, i32* %tmpfld
  %ldarg2 = load %test.OptionalNode, %test.OptionalNode* %arg2
  %tmpld_cls1 = load %test.Node*, %test.Node** %arg0
  %tmpfld2 = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls1, i32 0, i32 1
  store %test.OptionalNode %ldarg2, %test.OptionalNode* %tmpfld2
  ret void
}

define i32 @"test.main$v"() {
entry:
  %s = alloca %test.OptionalNode, align 16
  %enm = alloca %test.OptionalNode
  %0 = bitcast %test.OptionalNode* %enm to %test.OptionalNode.nil*
  %1 = getelementptr inbounds %test.OptionalNode.nil, %test.OptionalNode.nil* %0, i32 0, i32 0
  store i8 0, i8* %1
  %2 = load %test.OptionalNode, %test.OptionalNode* %enm
  %tmpalloc = alloca %test.Node
  call void @"test.Node.!ctor$[test.Node]i[test.OptionalNode]"(%test.Node* %tmpalloc, i32 3, %test.OptionalNode %2)
  %enm1 = alloca %test.OptionalNode
  %3 = bitcast %test.OptionalNode* %enm1 to %test.OptionalNode.some*
  %4 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %3, i32 0, i32 0
  store i8 1, i8* %4
  %5 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %3, i32 0, i32 1
  store %test.Node* %tmpalloc, %test.Node** %5
  %6 = load %test.OptionalNode, %test.OptionalNode* %enm1
  store %test.OptionalNode %6, %test.OptionalNode* %s
  %7 = getelementptr inbounds %test.OptionalNode, %test.OptionalNode* %s, i32 0, i32 0
  %8 = load i8, i8* %7
  switch i8 %8, label %match_end [
    i8 1, label %case1
  ]

case1:                                            ; preds = %entry
  %n = alloca %test.Node*, align 8
  %9 = bitcast %test.OptionalNode* %s to %test.OptionalNode.some*
  %10 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %9, i32 0, i32 1
  %11 = load %test.Node*, %test.Node** %10
  store %test.Node* %11, %test.Node** %n
  %tmpld_cls = load %test.Node*, %test.Node** %n
  %tmpgetfldgep = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls, i32 0, i32 0
  %tmpgetfldld = load i32, i32* %tmpgetfldgep
  %print_i = call i32 (i8*, ...) @printf(i8* getelementptr inbounds ([4 x i8], [4 x i8]* @str, i32 0, i32 0), i32 %tmpgetfldld)
  br label %match_end

match_end:                                        ; preds = %case1, %entry
  %r = alloca i32, align 4
  store i32 0, i32* %r
  %tmploadlocal = load i32, i32* %r
  ret i32 %tmploadlocal
}

define i32 @main() {
entry:
  %call = tail call i32 @"test.main$v"()
  ret i32 %call
}

现在，正如我所说的那样编译并完全运行，但由于某种原因，它有时会打印1而不是3，我根本不理解。我不知道如何调试llvm ir代码并使用opt生成错误的源代码行（所有变化的偏移量）也会产生NO SENSE（我正在使用llvm 8 btw但是我之前使用的llvm 6.0.1）相同的结果）。

然后，如果我在匹配语句之前向上移动r变量的定义，突然我得到一个段错误，由于我之前提到的偏移ir源线，我无法确定其位置。

这是相应的代码和ir：

class Node {
    fld value: int;
    fld next: OptionalNode;

    new(_value: int, _next: OptionalNode) {
        value = _value;
        next = _next;
    }
}

enum OptionalNode {
    val nil;
    val some(Node);
}

fun main(): int {
    var s: OptionalNode = OptionalNode.some(new Node(3, OptionalNode.nil));

    var r: int = 0;

    match s {
        OptionalNode.some(n) => print n.value;
    }

    ret r;
}

; ModuleID = 'test.bc'
source_filename = "test"

%test.Node = type { i32, %test.OptionalNode }
%test.OptionalNode = type { i8, [8 x i8] }
%test.OptionalNode.nil = type { i8 }
%test.OptionalNode.some = type { i8, %test.Node* }

@str = private unnamed_addr constant [4 x i8] c"%d\0A\00", align 1

declare i32 @printf(i8*, ...)

define void @"test.Node.!ctor$[test.Node]i[test.OptionalNode]"(%test.Node* %this, i32 %_value, %test.OptionalNode %_next) {
entry:
  %arg0 = alloca %test.Node*, align 8
  store %test.Node* %this, %test.Node** %arg0
  %arg1 = alloca i32, align 4
  store i32 %_value, i32* %arg1
  %arg2 = alloca %test.OptionalNode, align 16
  store %test.OptionalNode %_next, %test.OptionalNode* %arg2
  %ldarg1 = load i32, i32* %arg1
  %tmpld_cls = load %test.Node*, %test.Node** %arg0
  %tmpfld = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls, i32 0, i32 0
  store i32 %ldarg1, i32* %tmpfld
  %ldarg2 = load %test.OptionalNode, %test.OptionalNode* %arg2
  %tmpld_cls1 = load %test.Node*, %test.Node** %arg0
  %tmpfld2 = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls1, i32 0, i32 1
  store %test.OptionalNode %ldarg2, %test.OptionalNode* %tmpfld2
  ret void
}

define i32 @"test.main$v"() {
entry:
  %s = alloca %test.OptionalNode, align 16
  %enm = alloca %test.OptionalNode
  %0 = bitcast %test.OptionalNode* %enm to %test.OptionalNode.nil*
  %1 = getelementptr inbounds %test.OptionalNode.nil, %test.OptionalNode.nil* %0, i32 0, i32 0
  store i8 0, i8* %1
  %2 = load %test.OptionalNode, %test.OptionalNode* %enm
  %tmpalloc = alloca %test.Node
  call void @"test.Node.!ctor$[test.Node]i[test.OptionalNode]"(%test.Node* %tmpalloc, i32 3, %test.OptionalNode %2)
  %enm1 = alloca %test.OptionalNode
  %3 = bitcast %test.OptionalNode* %enm1 to %test.OptionalNode.some*
  %4 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %3, i32 0, i32 0
  store i8 1, i8* %4
  %5 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %3, i32 0, i32 1
  store %test.Node* %tmpalloc, %test.Node** %5
  %6 = load %test.OptionalNode, %test.OptionalNode* %enm1
  store %test.OptionalNode %6, %test.OptionalNode* %s
  %r = alloca i32, align 4
  store i32 0, i32* %r
  %7 = getelementptr inbounds %test.OptionalNode, %test.OptionalNode* %s, i32 0, i32 0
  %8 = load i8, i8* %7
  switch i8 %8, label %match_end [
    i8 1, label %case1
  ]

case1:                                            ; preds = %entry
  %n = alloca %test.Node*, align 8
  %9 = bitcast %test.OptionalNode* %s to %test.OptionalNode.some*
  %10 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %9, i32 0, i32 1
  %11 = load %test.Node*, %test.Node** %10
  store %test.Node* %11, %test.Node** %n
  %tmpld_cls = load %test.Node*, %test.Node** %n
  %tmpgetfldgep = getelementptr inbounds %test.Node, %test.Node* %tmpld_cls, i32 0, i32 0
  %tmpgetfldld = load i32, i32* %tmpgetfldgep
  %print_i = call i32 (i8*, ...) @printf(i8* getelementptr inbounds ([4 x i8], [4 x i8]* @str, i32 0, i32 0), i32 %tmpgetfldld)
  br label %match_end

match_end:                                        ; preds = %case1, %entry
  %tmploadlocal = load i32, i32* %r
  ret i32 %tmploadlocal
}

define i32 @main() {
entry:
  %call = tail call i32 @"test.main$v"()
  ret i32 %call
}

我知道这些问题真的很糟糕，我可能只是把我的代码扔进这里就违反了一些规则，但是如果有人会牺牲一些时间来帮助一些真正沮丧并且接近放弃的人，我会成为真的很感激。

Answer 1

这当然看起来很棘手。我想我有你的问题的答案。

当您尝试打印％tmpgetfldld时会导致段错误。如果您尝试使用clang进行编译然后执行它，则不会出现段错误。这并不是说它是lli的错，因为即使这样你也会得到错误的输出，因为你正在访问无效的内存空间。让我解释一下这是如何发生的。

％tmpgetfldld（无效）是一个i32，它原来是从％n指向的内存地址中提取的，上面有3行：

%tmpld_cls = load %test.Node*, %test.Node** %n

如果％tmpgetfldld的值无效，则表示存储到％n的％11无效。原因是这条指令：

%9 = bitcast %test.OptionalNode* %s to %test.OptionalNode.some*

在程序的开始时，你已经分配了指针％s的大小等于％test.OptionalNode对象的大小，它是9个字节（1个字节，另外8个字节用于数组）。然后，您将％s的bitcast注册到％9，以键入％test.OptionalNode.some。此类型的总大小为1 + 4 + 1 + 8 * 1 = 14个字节。在你的程序的这一点上，没有任何错误，％9指向同一地址％s，但你只把它作为％test.OptionalNode.some。但是，在该内存空间中，您已经分配了9个字节，现在通过“getelementptr”或“extractvalue”指令可以访问14个字节。在第9个字节后读取会导致段错误。的确，通过这些指示：

%10 = getelementptr inbounds %test.OptionalNode.some, %test.OptionalNode.some* %9, i32 0, i32 1
%11 = load %test.Node*, %test.Node** %10

你得到一个指向字节1到13的指针（从索引0开始计数）。然后将此指针存储在下方并再次加载，只有在您尝试访问访问％tmpgetfldld时发生的值时才会获得段错误。

要解决段错误，您需要以某种方式警告编译器，在分配％s或任何其他％test.OptionalNode时，您至少有9个字节，但是您可能需要更多，例如，如果您需要更多的结构更大的尺寸。实际上，这正是LLVM如何处理虚拟类和多态，当子类具有可变大小的成员时，但仍然必须以某种方式对父类进行操作。因此，如果您将％test.OptionalNode结构声明更改为此，则解决了segfault：

%test.OptionalNode = type { i8, [8 x i8], i8(...)** }

最后一种类型是一个函数指针，指示您期望i8（字节）的变量数。请点击此处：LLVM what does i32 (...)** mean in type define?

如果你做了这个改变，你摆脱了段错误，但你会注意到你还没有完全解决你的问题。有时你可能得到一个3作为输出，有时是其他东西，有点不明确的行为。这是因为，即使您声明了i8（...）**来解释bitcasted结构类型的额外字节，但是两种结构类型之间的公共内存区域中的数据类型也没有很好地对齐。您会注意到它们的区别从第二个字节开始：在％test.OptionalNode中启动一个i8数组，而在％test.OptionalNode.some中，有一个i32，然后是一个i8，然后是i8的相同数组。要解决这个问题，您必须将结构定义更改为：

%test.OptionalNode = type { i8, [8 x i8], i8(...)** }
%test.OptionalNode.some = type { i8, [8 x i8], %test.Node* }

或者那个：

%test.OptionalNode = type { i8, i8(...)** }
%test.OptionalNode.some = type { i8, %test.Node* }

取决于您的设计是否需要[8 x i8]阵列。现在，您的输出始终为3，您的问题就消失了。我认为这个解决方案也涵盖了您之前的问题（How to fix segmentation fault in genrated llvm bytecode?）。

对不起，答案很长。我希望它有所帮助。

为什么这个LLVM IR代码会产生意想不到的结果？

问题描述投票：-1回答：1

1个回答

最新问题

为什么这个LLVM IR代码会产生意想不到的结果？

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1