分类: 嵌入式
2011-09-19 20:52:30
内核级的程序,总有死机的时候,如果运气好,会看到一些所谓“Oops”信息(在屏幕上或系统日志中)
比如:
Unable to handle kernel paging request at virtual address f899b670
printing eip:
c01de48c
*pde = 00737067
Oops: 0002 [#1]
Modules linked in: bluesmoke_e752x bluesmoke_mc md5 ipv6 parport_pc
lp parport nls_cp936 vfat fat dm_mod button battery asus_acpi ac joydev
CPU: 0
EIP: 0060:[] Not tainted VLI
EFLAGS: 00210286 (2.6.9-11.21AXKProbes)
EIP is at kobject_add+0x83/0xd7
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
Oops 可以看成是内核级的Segmentation Fault。应用程序如果进行了非法内存访问或执行了非法指令,会得到Segfault信号,一般的行为是coredump,应用程序也可以自己截获Segfault信号,自行处理。如果内核自己犯了这样的错误,则会打出Oops信息。
Oops异常分析:编写内核模块,产生内核异常,根据OOPS分析异常原因
异常代码:
#include
#include
#include
void D(void)
{
int *p = NULL;
int a = 6;
printk("Function D\n");
*p = a+5;
}
void C(void)
{
printk("Function C\n");
D();
}
void B(void)
{
printk("Function B\n");
C();
}
void A(void)
{
printk("Function A\n");
B();
}
int oops_init(void)
{
printk("oops init\n");
A();
return 0;
}
void oops_exit(void)
{
printk("oops exit!\n");
}
module_init(oops_init);
module_exit(oops_exit);
MODULE_LICENSE("GPL");
MODULE_AUTHOR("David Xie");
1、编译加载模块
2、加载模块时出现了oops错误信息
3、分析错误原因:“Unable to handle kernel NULL pointer dereference at vitual address 00000000” 说明了出错原因是对空指针的非法访问
4、找到出错位置:”PC is at D+0x1c/0x28[oops]”说明出错的位置位于D函数偏移的0x1c处。
5、反汇编找到出错位置
# objdump –D –S oops.ko > log
如果在编译过程中加上选项”-g”调试选项就可以看到相对应的C语言代码,就很容易找到问题所在
加上调试选项: 在内核中Makefile文件中使”-g”使能