如何分析oops-wangchenxicool-ChinaUnix博客

wangchenxicoolwcx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

wangchenxicool

博客访问： 4316635
博文数量： 776
博客积分： 13014
博客等级：上将
技术积分： 10391
用户组：普通用户
注册时间： 2010-02-22 17:00

文章分类

全部博文（776）

x11（1）
avr-gcc（0）
iptables（3）
hostapd（3）
codes（8）
wcx_bb（11）
mini_httpd（1）
cups（2）
lubuntu（1）
kubuntu（2）
ncurses（1）
openwrt（19）
centos（2）
busybox（2）
shell（1）
protel（2）
android（7）
cubieboard（17）
ok6410（1）
AOI（0）
opencv（3）
onvif（5）
i2c（1）
vmware（1）
arduino（14）
a31（12）
qt（46）
bb-black（3）
pcDuino（24）
lua（3）
mfc（20）
dxf/svg/xml（7）
libevent（3）
linux维护（2）
软件调试（16）

Oops（5）
移植（10）
vim（26）
spi（14）
嵌入式（12）
常用算法（7）
数据库（13）
linux多线程编程（21）
linux网络编程（54）

socket网络编程（13）
硬件（3）
ftp（15）
c/c++（51）
电子（4）
ubuntu（42）
pppd/vpn（19）

pppd移植（1）
linux笔记（40）
工程师手册（18）
dbus（14）
我做过的项目（11）
3G模块（19）
pic（2）
makefile（7）
shell（74）
linux函数（10）
driver（29）
未分配的博文（17）

文章存档

2015年（55）

2014年（43）

2013年（147）

2012年（20）

2011年（82）

2010年（429）

我的朋友

相关博文

如何分析oops

分类： LINUX

2011-04-14 21:56:06

1. Oops是什么？

看LKD对oops的描述，oops就应该是unix系统的system panic，叫法不同而已。

什么是panic呢？简单的说就是内核程序错误引发的一种debug和保护机制，系统会dump出内核映像，里面包含了当时CPU的状态，进程的状态，内核堆，栈的状态...最直观的最重要的恐怕就是调用栈的back trace.

很多情况下，一个oops是可以被重现的，根据调用栈的back trace和printk也许就搞定了问题。
但更多的时候，一个oops是很难重现，比如一个race condition.
这时候，分析一个oops之后的crash dump文件就变得尤为重要了。

2. 如何分析oops.

分析panic的思路和分析应用程序coredump的思路一样的。

首先，要看调用的backtrace和错误消息.

看程序是在哪个函数产生发生了错误，看消息里面有什么有价值的信息，比如空指针引用之类的。

其次，了解了backtrace在什么位置，就可以结合源代码来看是否有问题了。

幸运的话，光看具体函数的代码也许就会发现问题。

但多数时候，还需要检查crash dump的映像文件的。

这时候，一个好用的帮助分析crash dump的工具就尤为重要了。

在solaris下，我们可以通过mdb来查看panic时在CPU运行的所有线程的状态，

CPU寄存器的状态，信号量，锁...
因为IA32的特性，调用栈、backtrace里面每个函数的参数，都可以得到。
此外还有堆的状态。

通过以上这些数据，我们会试图重新描绘出系统崩溃那一刹那，发生了什么。

在linux下，该如何做类似的分析工作呢？

因为种种原因，linux至今没有集成kernel debug工具，但还是有一些第3方工具可用：

1.kdb

特点：二进制，汇编级的调试工具。只需要一台机器。

2.kgdb

特点：源代码级的调试工具，但需要两台机器，null modem线连接。

局限：需要patch重新编译内核。而且，在事后分析crash dump文件的情况下，尤其是当oops不可重现时，只能在汇编和二进制下工作了。

3.gdb

特点：linux环境中自带

局限：功能有限，但检查crash dump也许足够了。

linus本人不提倡用kernel debug工具，那他们是如何检查一个crash dump文件的呢？我猜想是用gdb

阅读(2003) | 评论(0) | 转发(0) |

上一篇：Vim代码注释插件 - NERD Commenter

下一篇：使用 Crash 工具分析 Linux dump 文件

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6