64位x86的函数调用栈布局-独孤毛毛-ChinaUnix博客

独孤毛毛awp47.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

独孤毛毛

博客访问： 888281
博文数量： 581
博客积分： 7803
博客等级：少将
技术积分： 3653
用户组：普通用户
注册时间： 2007-04-27 08:21

文章分类

全部博文（581）

Language（11）

Haskell（1）
Filesystem（19）
Tool（44）

Emacs（3）

TeX（7）
Storage（26）
OS（80）

Linux（61）

RTEMS（0）

PowerPC（1）
Other（57）
未分配的博文（344）

文章存档

2013年（7）

2012年（414）

2011年（159）

2009年（1）

我的朋友

最近访客

推荐博文

64位x86的函数调用栈布局

分类：

2011-12-06 12:46:56

原文地址：64位x86的函数调用栈布局作者：GFree_Wind

作者：gfree.wind@gmail.com

博客：blog.focus-linux.net linuxfocus.blog.chinaunix.net

在看本文之前，如果不了解x86的32位机的函数布局的话，建议先阅读一下前一篇文章《如何手工展开函数栈定位问题》—— http://blog.chinaunix.net/space.php?uid=23629988&do=blog&id=3029639

为啥还要就64位的情况单开一篇文章呢，难道64位与32位不一样吗？

还是先看测试代码：

#include <stdlib.h>
#include <stdio.h>
static void test(void *p1, void *p2, int p3)
{
p1 = p1;
p2 = p2;
p3 = p3;
}
int main()
{
void *p1 = (void*)1;
void *p2 = (void*)2;
int p3 = 3;
test(p1, p2, p3);
return 0;
}

编译gcc -g -Wall test.c，调试进入test

(gdb) bt
#0 test (p1=0x1, p2=0x2, p3=3) at test.c:10
#1 0x0000000000400488 in main () at test.c:18

查看寄存器bp

(gdb) info registers rbp
rbp 0x7fffab620d00 0x7fffab620d00

那么检查栈的内容

(gdb) x /16xg 0x7fffab620d00
0x7fffab620d00: 0x00007fffab620d30 0x0000000000400488
0x7fffab620d10: 0x00000000004004a0 0x0000000000000002
0x7fffab620d20: 0x0000000000000001 0x0000000300000000
0x7fffab620d30: 0x0000000000000000 0x00007f93bbaa11c4
0x7fffab620d40: 0x0000000000400390 0x00007fffab620e18
0x7fffab620d50: 0x0000000100000000 0x0000000000400459
0x7fffab620d60: 0x00007f93bc002c00 0x85b4aff07d2e87c7
0x7fffab620d70: 0x0000000000000000 0x00007fffab620e10

开始分析栈的内容：

1. 0x00007fffab620d30：为test调用者main的BP内容，没有问题；

2. 0x0000000000400488：为test的返回地址，与前面的bt输出相符，没有问题；

3. 0x00000000004004a0：——这个是什么东东？？！！

4. 0x0000000000000002， 0x0000000000000001， 0x0000000300000000：这里也有不少疑问啊？！

1. 这个0x00000003是第3个参数？因为是整数所以在64位的机器上，只使用栈的一个单元的一半空间？

2. 参数的顺序为什么是3,1,2呢？难道是因为前两个参数为指针，第三个参数为int有关？

我在工作中遇到了类似的问题，所以才特意写了上面的测试代码，就为了测试相同参数原型的函数调用栈的问题。看到这里，感觉很奇怪，对于上面两个问题很困惑啊。上网也没有找到64位的x86函数调用栈的特别的资料。

难道64位机与32位机有这么大的不同？！大家先想一下，答案马上揭晓。

当遇到疑难杂症时，汇编则是王道：

(gdb) disassemble main
Dump of assembler code for function main:
0x0000000000400459 : push %rbp
0x000000000040045a : mov %rsp,%rbp
0x000000000040045d : sub $0x20,%rsp
0x0000000000400461 : movq $0x1,-0x10(%rbp)
0x0000000000400469 : movq $0x2,-0x18(%rbp)
0x0000000000400471 : movl $0x3,-0x4(%rbp)
0x0000000000400478 : mov -0x4(%rbp),%edx
0x000000000040047b : mov -0x18(%rbp),%rsi
0x000000000040047f : mov -0x10(%rbp),%rdi
0x0000000000400483 : callq 0x400448
0x0000000000400488 : mov $0x0,%eax
0x000000000040048d : leaveq
0x000000000040048e : retq
End of assembler dump.

看红色部分的汇编代码，为调用test时的处理，原来64位机器上，调用test时，根本没有对参数进行压栈，所以上面对于栈内容的分析有误。后面的内存中存放的根本不是test的参数。看到汇编代码，我突然想起，由于64位cpu的寄存器比32位cpu的寄存器要多，所以gcc会尽量使用寄存器来传递参数来提高效率。

让我们重新运行程序，再次在test下查看寄存器内容：

(gdb) info registers
rax 0x7f141fea1a60 139724411509344
rbx 0x7f14200c2c00 139724413742080
rcx 0x4004a0 4195488
rdx 0x3 3
rsi 0x2 2
rdi 0x1 1
rbp 0x7fff9c08d380 0x7fff9c08d380
rsp 0x7fff9c08d380 0x7fff9c08d380

这里rdx，rsi和rdi清晰的显示了三个参数的值，分别为3,2,1与前面的反汇编代码相符。

而前面被当做参数的0x0000000000000002， 0x0000000000000001和0x00000003，其实为main中的局部变量p2, p1和p3的定义。如前面反汇编代码中的蓝色代码，这三个局部变量在栈上的定义顺序为p3, p1和p2，与栈的内容相符。

我写本文的目的，主要是为了与大家分享一下64位机器上调试时需要注意的一个问题：函数调用时，编译器会尽量使用寄存器来传递参数，这点与32位机有很大不同。在我们的调试中，要特别注意这点。

注：关于压栈顺序，参数的传递方式等等，都可以通过编译选项来指定或者禁止的。本文的情况为GCC的默认行为。

阅读(456) | 评论(0) | 转发(0) |

上一篇：GDB技巧：使用checkpoint解决难以复现的Bug

下一篇：如何手工展开函数栈来定位问题

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6