如何阅读、理解、分析和调试 Linux 内核恐慌？

Question

考虑以下 Linux 内核转储堆栈跟踪；例如，您可以通过调用

panic("debugging a Linux kernel panic");

:

从内核源代码触发恐慌

[<001360ac>] (unwind_backtrace+0x0/0xf8) from [<00147b7c>] (warn_slowpath_common+0x50/0x60)
[<00147b7c>] (warn_slowpath_common+0x50/0x60) from [<00147c40>] (warn_slowpath_null+0x1c/0x24)
[<00147c40>] (warn_slowpath_null+0x1c/0x24) from [<0014de44>] (local_bh_enable_ip+0xa0/0xac)
[<0014de44>] (local_bh_enable_ip+0xa0/0xac) from [<0019594c>] (bdi_register+0xec/0x150)

在
```
unwind_backtrace+0x0/0xf8
```
中，
```
+0x0/0xf8
```
代表什么？
如何查看
```
unwind_backtrace+0x0/0xf8
```
的C代码？
如何解读恐慌的内容？

Answer 1

这只是一个普通的回溯。这些函数以相反的顺序调用；列出的第一个函数被下一个函数调用。下面我添加了

[was called]

以进一步澄清：

(unwind_backtrace+0x0/0xf8) [was called] from (warn_slowpath_common+0x50/0x60)
(warn_slowpath_common+0x50/0x60) [was called] from (warn_slowpath_null+0x1c/0x24)
(warn_slowpath_null+0x1c/0x24) [was called] from (local_bh_enable_ip+0xa0/0xac)
(local_bh_enable_ip+0xa0/0xac) [was called] from (bdi_register+0xec/0x150)

bdi_register+0xec/0x150

是符号+偏移/长度。有关此内容的更多信息，请参阅了解内核 Oops 以及如何调试内核 oops。另外，还有关于“调试内核”的优秀教程。注意：按照 Eugene 下面的建议，您可能想先尝试

addr2line

。不过，它需要带有调试符号的图像。例如：

addr2line -e vmlinux_with_debug_info 0019594c(+offset)

Answer 2

addr2line

。假设您拥有正确的目标工具链，您可以执行以下操作之一：

使用

objdump：

vmlinux
或
```
.ko
```
文件，然后反汇编目标文件:
objdump -dS vmlinux > /tmp/kernel.s
/tmp/kernel.s
。使用文本编辑器，例如
```
vim
```
。去
```
unwind_backtrace+0x0/0xf8
```
，即搜索
```
unwind_backtrace
```
+
```
offset
```
的地址。最后，您在源代码中找到了有问题的部分。

使用

gdb：

IMO，一种更优雅的选择是使用唯一的

gdb

。假设您的主机上有合适的工具链：

运行

gdb <path-to-vmlinux>

。
在gdb的提示符下执行：

list *(unwind_backtrace+0x10)

.

如需了解更多信息，您可以查看以下资源：

.

Answer 3

在

unwind_backtrace+0x0/0xf8
中，
+0x0/0xf8
代表什么？
第一个数字 (

+0x0

) 是距函数开头的

偏移量

（在本例中为 unwind_backtrace）。第二个数字 (

0xf8

) 是

函数的总长度

。有了这两条信息，如果您已经预感到错误发生的位置，这可能足以证实您的怀疑（您可以（大致）知道您在函数中进行了多远）。要获取相应指令的确切源代码行（通常比预感更好），请使用

addr2line

或其他答案中的其他方法。

如何阅读、理解、分析和调试 Linux 内核恐慌？

问题描述投票：0回答：3

3个回答

最新问题

如何阅读、理解、分析和调试 Linux 内核恐慌？

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3