Chinaunix首页 | 论坛 | 博客
  • 博客访问: 245671
  • 博文数量: 47
  • 博客积分: 1229
  • 博客等级: 中尉
  • 技术积分: 568
  • 用 户 组: 普通用户
  • 注册时间: 2010-09-20 10:06
文章分类

全部博文(47)

文章存档

2014年(1)

2013年(7)

2012年(1)

2011年(38)

分类: LINUX

2013-02-27 03:59:10


“调试难度本来就是写代码的两倍.因此,如果你写代码的时候聪明用尽,根据定义,你就没有能耐去调试它了.” – Brian Kernighan


某手机公司的研发总监谈到内核调试时问我怎么android手机上解决有时整机响应慢甚至无响应的情况。 我说可以首先使能内核的调试选项检查是否存在内核死锁,再通过内核的kprobe/ftrace检查中断和系统调用情况,blabla… 没想到该总说“我们公司几百号人都没有用trace,你能用得起来?”。难怪即使几百号人做手机,每个人还得被强制加班?


据说,linus等大神级内核开发者不用调试器,顶多用printk打印信息。 对于寻常百姓来说, 每改一行代码都希望能马上看到效果,一次次的编译内核,就像盲人摸象一样,这时printk就像烧火棍一样, 难堪重用,调试效率效率非常的低。ftrace是内核内置的跟踪器,可用于跟踪内核函数调用,中断延迟,调度延迟, 系统调用等,在debugfs下使用文本命令交互,很合适内核开发者使用。


使用 ftrace
首先使用CONFIG_DEBUG_FS,CONFIG_FTRACE_*选项后重新编译内核。需要注意的是, 由于这时编译器打开-pg选项,内核映像加入了大量的调试信息,内核运行速度会变慢。 所以正式发布的版本都应该关闭此选项。


# mount -t debugfs nodev /sys/kernel/debug
# cd /sys/kernel/debug/trace
该目录下包含很多文件,用于设定/过滤/查看等,如:


内核中断
查看当前系统的中断情况


# echo 0 > tracing_on
# echo > trace
# echo nop > current_tracer
# echo irq > set_event
# echo 1 > tracing_on
# cat trace_pipe
 tracer: nop
 entries-in-buffer/entries-written: 0/0   #P:1


                              _-----=> irqs-off
                             / _----=> need-resched
                            | / _---=> hardirq/softirq
                            || / _--=> preempt-depth
                            ||| /     delay
           TASK-PID   CPU#  ||||    TIMESTAMP  FUNCTION
              | |       |   ||||       |         |
cat-1449  [000] d.h.  3927.679420: irq_handler_entry: irq=4 name=serial
...
内核调用
查看内核函数的调用情况


# echo > set_event
# echo 0 > tracing_on
# echo > trace
# echo function_graph > current_tracer
# echo 1 > tracing_on
# cat trace_pipe


tracer: function_graph


CPU  DURATION                  FUNCTION CALLS
 |     |   |                     |   |   |   |
0) + 26.523 us   |                      }
0)               |            finish_task_switch() {
0)   ==========> |
0)               |              smp_apic_timer_interrupt() {
0)               |                irq_enter() {
0)   0.911 us    |                  rcu_irq_enter();
0)   6.503 us    |                }
0)               |                hrtimer_interrupt() {
0)   0.585 us    |                  _raw_spin_lock();
0)   1.124 us    |                  ktime_get_update_offsets();
CPU:0 [LOST 163499 EVENTS]
------------------------------------------
0)  kworker-691   =>    cat-1464   
------------------------------------------


0)               |                              serial8250_default_handle_irq() {
0)   0.954 us    |                                io_serial_in();
...
内核函数的profile
打印当前内核的函数profile


# echo > current_tracer
# echo 1 > function_profile_enabled
# cat trace_stat/function0 
Function                               Hit    Time            Avg             s^2
--------                               ---    ----            ---             ---
__schedule                            7113    968683296 us     136184.9 us     2108946573 us 
schedule                              1687    954817829 us     565985.6 us     1349415472 us 
sys_poll                                25    63786678 us     2551467 us     582022796 us 
do_sys_poll                             25    63786547 us     2551461 us     566803126 us 
poll_schedule_timeout                   25    63771744 us     2550869 us     1312623772 us 
schedule_hrtimeout_range                25    63771626 us     2550865 us     1305229109 us 
schedule_hrtimeout_range_clock          25    63771510 us     2550860 us     1293434582 us 
schedule_timeout                        29    34992964 us     1206653 us     1503283302 us 
...
上面仅列出ftrace的三种应用场景,其它更多的说明可见Documentation/trace/ftrace.txt。 通过ftrace可以实时的跟踪内核的运行情况,通过分析它的日志,一般能较快的找出内核的性能瓶颈。


~EOF~ 2013.02.25

阅读(10446) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~