全部博文(113)
分类: C/C++
2009-12-05 14:30:05
GDB查看堆栈局部变量
“参数从右到左入栈”,“局部变量在栈上分配空间”,听的耳朵都起茧子了。最近做项目涉及C和汇编互相调用,写代码的时候才发现没真正弄明白。自己写了个最简单的函数,用gdb跟踪了调用过程,才多少懂了一点。
参考资料:
http://blog.csdn.net/liigo/archive/2006/12/23/1456938.aspx
http://blog.csdn.net/eno_rez/archive/2008/03/08/2158682.aspx
int add(int x, int y)
{
int a = 0;
a = x;
a += y;
return a;
}
int main(int argc, char *argv[])
{
int x, y, result;
x = 0x12;
y = 0x34;
result = add(x, y);
return 0;
}
编译:(Fedora6, gcc
[test]$ gcc -g -Wall -o stack stack.c
反汇编:
这里的汇编的格式是AT&T汇编,它的格式和我们熟悉的汇编格式不太一样,尤其要注意源操作数和目的操作数的顺序是反过来的
[test]$ objdump -d stack > stack.dump
[test]$ cat stack.dump
......
08048354 :
8048354: 55 push %ebp ;保存调用者的帧指针
8048355: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针
8048357: 83 ec 10 sub $0x10,%esp ;调整栈指针,为局部变量保留空间
8048361: 8b 45 08 mov 0x8(%ebp),%eax ;把参数x保存到eax。ebp+8的位置是最后一个入栈的参数,也就是第一个参数
8048364: 89 45 fc mov %eax,0xfffffffc(%ebp) ;把eax赋值给变量a
8048367: 8b 45
804836d: 8b 45 fc mov 0xfffffffc(%ebp),%eax ;把a的值作为返回值,保存到eax
8048370: c9 leave
8048371: c3 ret
08048372 :
8048372: 8d
8048376: 83 e
8048379: ff 71 fc pushl 0xfffffffc(%ecx) ;????
804837d: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针
8048380: 83 ec 18 sub $0x18,%esp ;调整栈指针,为局部变量保留空间
8048383: c7
8048391: 8b
8048394: 89 44 24 04 mov %eax,0x4(%esp) ;y作为最右边的参数首先入栈
8048398: 8b
804839b: 89 04 24 mov %eax,(%esp) ;x第二个入栈
804839e: e8 b1 ff ff ff call 8048354 ;调用add
80483ab:
80483ae: 59 pop %ecx ;
80483af: 5d pop %ebp ;
80483b0: 8d 61 fc lea 0xfffffffc(%ecx),%esp ;
80483b3: c3 ret
80483b4: 90 nop
......
有一点值得注意的是main在调用add之前把参数压栈的过程。
它用的不是push指令,而是另一种方法。
在main入口调整栈指针的时候,也就是位于8048380的这条指令 sub $0x18,%esp
不但象通常函数都要做的那样给局部变量预留了空间,还顺便把调用add的两个参数的空间也预留出来了。
然后把参数压栈的时候,用的是mov指令。
我不太明白这种方法有什么好处。
另外一个不明白的就是main入口的四条指令8048372、8048376、8048379、804837f,还有与之对应的main返回之前的指令。
貌似main对esp要求16字节对齐,所以先把原来的esp压栈,然后强行把esp的低4位清0。等到返回之前再从栈里恢复原来的esp
准备工作都做好了,现在开始gdb
对gdb不太熟悉的同学要注意一点,stepi命令执行之后显示出来的源代码行或者指令地址,都是即将执行的指令,而不是刚刚执行完的指令。
我在每个stepi后面都加了注释,就是刚执行过的指令。
[test]$ gdb -q stack
(gdb) break main
Breakpoint 1 at 0x8048383: file stack.c, line 11.
gdb并没有把断点设置在main的第一条指令,而是设置在了调整栈指针为局部变量保留空间之后
(gdb) run
Starting program: /home/brookmill/test/stack
Breakpoint 1, main () at stack.c:11
11 x = 0x12;
(gdb) stepi // 注释: movl $0x12,0xfffffff0(%ebp)
12 y = 0x34;
(gdb) stepi // 注释: movl $0x34,0xfffffff4(%ebp)
13 result = add(x, y);
(gdb) info registers esp
esp 0xbf8df
(gdb) info registers ebp
ebp 0xbf8df
(gdb) x/12 0xbf8df
0xbf8df
0xbf8df8b0: 0x001ca8d5 0xbf8df
0xbf8df
这就是传说中的栈。在main准备调用add之前,先看看这里有些什么东东
0xbf8df
0xbf8df8cc(ebp+4)保存的是main的返回地址0x001b4dec
0xbf8df8b8(ebp-16)是局部变量x,已经赋值0x12;
0xbf8df8bc(ebp-12)是局部变量y,已经赋值0x34;
0xbf8df
现在开始调用add
(gdb) stepi // 注释: mov 0xfffffff4(%ebp),%eax
0x08048394 13 result = add(x, y);
(gdb) stepi // 注释: mov %eax,0x4(%esp)
0x08048398 13 result = add(x, y);
(gdb) x/12 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
y首先被压栈,在0xbf8df8b0
(gdb) stepi // 注释: mov 0xfffffff0(%ebp),%eax
0x0804839b 13 result = add(x, y);
(gdb) stepi // 注释: mov %eax,(%esp)
0x0804839e 13 result = add(x, y);
(gdb) x/12 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
x第二个进栈,在0xbf8df
(gdb) stepi // 注释: call 8048354
add (x=18, y=52) at stack.c:2
2 {
刚刚执行了call指令,现在我们进入了add函数
(gdb) info registers esp
esp 0xbf8df
(gdb) info registers ebp
ebp 0xbf8df
(gdb) x/12 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
现在esp指向0xbf8df
(gdb) stepi // 注释: push %ebp
0x08048355 2 {
(gdb) stepi // 注释: mov %esp,%ebp
0x08048357 2 {
(gdb) stepi // 注释: sub $0x10,%esp
3 int a = 0;
(gdb) info registers esp
esp 0xbf8df894 0xbf8df894
(gdb) info registers ebp
ebp 0xbf8df
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
刚刚执行完的3条指令是函数入口的定式。
现在我们可以看到,main的栈还是原样,向下增长之后就是add的栈。
0xbf8df
0xbf8df
0xbf8df
0xbf8df8b0(ebp+C)保存的是倒数第二个入栈的参数y
0xbf8df
接下来add函数就真正开始干活了
(gdb) stepi // 注释: movl $0x0,0xfffffffc(%ebp)
4 a = x;
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
可以看到a被置0了
(gdb) stepi // 注释: mov 0x8(%ebp),%eax
0x08048364 4 a = x;
(gdb) stepi // 注释: mov %eax,0xfffffffc(%ebp)
5 a += y;
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
参数x(ebp+8)的值通过eax赋值给了局部变量a(ebp-4)
(gdb) stepi // 注释: mov 0xc(%ebp),%eax
0x
(gdb) stepi // 注释: add %eax,0xfffffffc(%ebp)
6 return a;
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
参数y(ebp+C)的值通过eax加到了局部变量a(ebp-4)
现在要从add返回了。返回之前把局部变量a(ebp-4)保存到eax用作返回值
(gdb) stepi // 注释: mov 0xfffffffc(%ebp),%eax
7 }
(gdb) stepi // 注释: leave
0x
7 }
(gdb) stepi // 注释: ret
0x
13 result = add(x, y);
现在我们回到了main,栈现在是这样的
(gdb) info registers esp
esp 0xbf8df
(gdb) info registers ebp
ebp 0xbf8df
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
可以看到,esp和ebp都已经恢复到了调用add之前的值。
但是,调用add的两个参数还在栈里(0xbf8df
也就是说,被调用的函数add没有把它们从栈上清出去,需要调用方main来清理。这就是著名的“调用者清栈”,cdecl调用方式的特点之一。
(gdb) stepi // 注释: mov %eax,0xfffffff8(%ebp)
14 return 0;
(gdb) x/16 0xbf8df890
0xbf8df890: 0x00000000 0x08049574 0xbf8df
0xbf8df
0xbf8df8b0: 0x00000034 0xbf8df
0xbf8df
从eax得到函数add的返回值,赋值给了局部变量result(ebp-8)
(gdb) stepi // 注释: mov $0x0,%eax ;把eax置0作为main的返回值
15 }
(gdb) stepi // 注释: add $0x18,%esp ; 调用者清栈
0x080483ae 15 }
(gdb) continue
Continuing.
Program exited normally.
(gdb) quit
[test]$