Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7675905
  • 博文数量: 961
  • 博客积分: 15795
  • 博客等级: 上将
  • 技术积分: 16612
  • 用 户 组: 普通用户
  • 注册时间: 2010-08-07 14:23
文章分类

全部博文(961)

文章存档

2016年(1)

2015年(61)

2014年(41)

2013年(51)

2012年(235)

2011年(391)

2010年(181)

分类: 嵌入式

2011-09-19 20:52:30

内核级的程序,总有死机的时候,如果运气好,会看到一些所谓“Oops”信息(在屏幕上或系统日志中)

比如:

Unable to handle kernel paging request at virtual address f899b670

printing eip:

c01de48c

*pde = 00737067

Oops: 0002 [#1]

Modules linked in: bluesmoke_e752x bluesmoke_mc md5 ipv6 parport_pc

lp parport nls_cp936 vfat fat dm_mod button battery asus_acpi ac joydev

CPU: 0

EIP: 0060:[] Not tainted VLI

EFLAGS: 00210286 (2.6.9-11.21AXKProbes)

EIP is at kobject_add+0x83/0xd7

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

 

Oops 可以看成是内核级的Segmentation Fault。应用程序如果进行了非法内存访问或执行了非法指令,会得到Segfault信号,一般的行为是coredump,应用程序也可以自己截获Segfault信号,自行处理。如果内核自己犯了这样的错误,则会打出Oops信息。

 

Oops异常分析:编写内核模块,产生内核异常,根据OOPS分析异常原因

异常代码:

#include

#include

#include

 

void D(void)

{

    int *p = NULL;

    int a = 6;

    printk("Function D\n");

    *p = a+5;

}

 

void C(void)

{

    printk("Function C\n");

    D();

}

 

void B(void)

{

    printk("Function B\n");

    C();

}

 

void A(void)

{

    printk("Function A\n");

    B();

}

 

int oops_init(void)

{

    printk("oops init\n");

    A();

    return 0;

}

 

void oops_exit(void)

{

     printk("oops exit!\n");

}

 

module_init(oops_init);

module_exit(oops_exit);

MODULE_LICENSE("GPL");

MODULE_AUTHOR("David Xie");

 

1、编译加载模块

2、加载模块时出现了oops错误信息

3、分析错误原因:“Unable to handle kernel NULL pointer dereference at vitual address 00000000” 说明了出错原因是对空指针的非法访问

4、找到出错位置:”PC is at D+0x1c/0x28[oops]”说明出错的位置位于D函数偏移的0x1c处。

5、反汇编找到出错位置

       # objdump –D –S oops.ko > log

       如果在编译过程中加上选项”-g”调试选项就可以看到相对应的C语言代码,就很容易找到问题所在

加上调试选项:    在内核中Makefile文件中使-g使能

阅读(1825) | 评论(0) | 转发(3) |
0

上一篇:Proc文件系统

下一篇:字符设备驱动

给主人留下些什么吧!~~