gcc中的内嵌汇编语言（Intel i386平台）（二）-xuelei

努力挣钱，为了一个‘好’字！

首页　| 　博文目录　| 　关于我

xuelei_51

博客访问： 1774830
博文数量： 207
博客积分： 1450
博客等级：上尉
技术积分： 2295
用户组：普通用户
注册时间： 2008-09-11 11:38

个人简介

学习永无止境！！

文章分类

全部博文（207）

Python（2）
AI（3）

caffe（1）

tensorflow（2）
硬件（1）

GPU（1）
数据库（1）
C++（2）
bitcoin（1）
嵌入式（23）

编译工具链（2）

编译工具链（1）

fdt（3）

busybox（1）

driver（2）

beaglebone（1）

openwrt（5）

lua（0）
Andriod（1）
WinCE（8）
Windows（10）

mysys2（2）

java（2）
C/C++资料（12）
随笔日记（7）
linux（126）

gdb（1）

python（2）

Fortran（2）

运行问题（1）

编译问题（0）

Makefile（3）

git（8）

sed和awk，shell（1）

u-boot（2）

socket（2）

kernel-3.8（4）

shell脚本（4）

bitbake（5）

命令（18）

文件系统（4）

Qt（2）

busybox（2）

kernel（15）

net（8）

gnu tools（12）
ARM资料（10）
未分配的博文（0）

文章存档

2025年（1）

2022年（5）

2019年（3）

2018年（8）

2017年（32）

2016年（7）

2015年（13）

2014年（44）

2013年（24）

2011年（6）

2010年（17）

2009年（46）

2008年（1）

我的朋友

相关博文

gcc中的内嵌汇编语言（Intel i386平台）（二）

分类： C/C++

2009-11-11 14:40:35

以举例的方式对gcc中的内嵌汇编语言进行的解释。

一、gcc对内嵌汇编语言的处理方式
　　 gcc在编译内嵌汇编语言时,采取的步骤如下：
　　变量输入：根据限定符的内容将输入操作数放入合适的寄存器,如果限定符指定为立即数("i")或内存变量("m"),则该步被省略,如果限定符没有具体指定输入操作数的类型(如常用的"g"),gcc会视需要决定是否将该操作数输入到某个寄存器.这样每个占位符都与某个寄存器,内存变量,或立即数形成了一一对应的关系.这就是对第二个冒号后内容的解释.如::"a"(foo),"i"(100),"m"(bar)表示%0对应eax寄存器,%1对应100,%2对应内存变量bar.
　　生成代码：然后根据这种一一对应的关系(还应包括输出操作符),用这些寄存器,内存变量,或立即数来取代汇编代码中的占位符(则有点像宏操作),注意,这一步骤并不检查由这种取代操作所生成的汇编代码是否合法,例如,如果有这样一条指令asm("movl %0,%1"::"m"(foo),"m"(bar));如果你用gcc -c -S选项编译该源文件,那么在生成的汇编文件中,你将会看到生成了movl foo,bar这样一条指令,这显然是错误的.这个错误在稍后的编译检查中会被发现.
　　变量输出：按照输出限定符的指定将寄存器的内容输出到某个内存变量中,如果输出操作数的限定符指定为内存变量("m"),则该步骤被省略.这就是对第一个冒号后内容的解释,如:asm("mov %0,%1":"=m"(foo),"=a"(bar):);编译后为：
　　　　 #APP
　　　　 movl foo,eax
　　　　 #NO_APP
　　　　 movl eax,bar
　　该语句虽然有点怪怪的,但它很好的体现了gcc的运作方式。

　　再以arch/i386/kernel/apm.c中的一段代码为例，我们来比较一下它们编译前后的情况：

源程序

__asm__ ( "pushl %%edi\n\t" "pushl %%ebp\n\t" "lcall %%cs:\n\t" "setc %%al\n\t" "addl %1,%2\n\t" "popl %%ebp\n\t" "popl %%edi\n\t" :"=a"(ea),"=b"(eb), 　 "=c"(ec),"=d"(ed),"=S"(es) :"a"(eax_in),"b"(ebx_in),"c"(ecx_in) :"memory","cc");

编译后的汇编代码

movl eax_in,%eax 　　 movl ebx_in,%ebx 　　 movl ecx_in,%ecx #APP GCC插入的注释，表示内嵌汇编开始　　 pushl %edi 内嵌的汇编语句　　 pushl %ebp 　　 lcall %cs: 　　 setc %al 　　 addl eb,ec 　　 popl %ebp 　　 popl %edi #NO_APP GCC 插入的注释，表示内嵌汇编结束　　 movl %eax,ea 　　 movl %ebx,eb 　　 movl %ecx,ec 　　 movl %edx,ed 　　 movl %esi,es

二、对第三个冒号后面内容的解释
　　第三个冒号后面内容主要针对gcc优化处理,它告诉gcc在本段汇编代码中对寄存器和内存的使用情况,以免gcc在优化处理时产生错误。它可以是"eax","ebx","ecx"等寄存器名,表示本段汇编代码对该寄存器进行了显式操作,如 asm ("mov %%eax,%0",:"=r"(foo)::"eax");这样gcc在优化时会避免使用eax作临时变量,或者避免cache到eax的内存变量通过该段汇编码。
　　下面的代码均用gcc的-O2级优化,它显示了嵌入汇编中第三个冒号后"eax"的作用

源程序

int main()
{
　　 int bar=1;
　　 bar=fun();
　　 bar++;
　　 return bar;
}

编译后的汇编代码
pushl %ebp
movl %esp,%ebp
call fun
incl %eax #显然,bar缺省使用eax寄存器
leave
ret

　　加了汇编后：

源程序

int main()
{
　　 int bar=1;
　　 bar=fun();
　　 asm volatile("" : : : "eax");
　　 bar++;
　　 return bar;
}

编译后的汇编代码
pushl %ebp
movl %esp,%ebp
call fun
movl %eax,%edx　　#bar改为使用edx寄存器
incl %edx
movl %edx,%eax　　#放入main()的返回值
ret
　　 "merory"是一个常用的限定,它表示汇编代码以不可预知的方式改变了内存,这样gcc在优化时就不会让cache到寄存器的内存变量使用该寄存器通过汇编代码,否则可能会发生同步出错.有了上面的例子,这个问题就很好理解了

三、对"&"限定符的解释
　　这是一个较常见用于输出的限定符，它告诉gcc输出操作数使用的寄存器不可再让输入操作数使用。
　　对于"g","r"等限定符,为了有效利用为数不多的几个通用寄存器,gcc一般会让输入操作数和输出操作数选用同一个寄存器。但如果代码没编好,会引起一些意想不到的错误，例如：
　　　　 asm("call fun;mov ebx,%1":"=a"(foo):"r"(bar));
　　 gcc编译的结果是foo和bar同时使用eax寄存器：
　　　　 movl bar,eax
　　　　 #APP
　　　　 call fun
　　　　 movl ebx,eax
　　　　 #NO_APP
　　　　 movl eax,foo
　　本来这段代码的意图是将fun()函数的返回值放入foo变量,但半路杀出个程咬金,用ebx的值冲掉了返回值,所以这是一段错误的代码,解决的方法是加上一个给输出操作数加上一个"&"限定符:
　　　　 asm("call fun;mov ebx,%1":"=&a"(foo):"r"(bar));
　　这样gcc就会让输入操作数另寻高就,不再使用eax寄存器了

补充说明：
　　其实&对读代码根本没有意义，只有GCC或写汇编的才关心。
　　如果你非要知道&的作用，这里解释一下。
　　 1. GCC处理嵌入汇编时，如果两个输入操作数值相同，可能会分配到同一个寄存器，以减少寄存器的使用。
　　 2. GCC把嵌入汇编看成一个整体，它并不知道是一条指令还是多条指令，通常它认为汇编指令输出结果时，输入操作数还没有改变，单条指令时，这种假设大多成立，但多条指令时可能不成立。比如定义如下：
　　　　 #define add1(a,b) asm("incl %0\n\taddl %2,%0":"=r"(res):"0"(a),"r"(b))
　　计算a+b+1。我们看看add1(a,a)生成的指令，假设%eax中包含a的值：
　　　　 #%0=eax,%2=eax
　　　　 #APP
　　　　 incl %eax
　　　　 addl %eax, %eax
　　　　 #NO_APP
　　结果不对，读或写汇编的人很容易看出这点，但是GCC不知道，加个&，定义写成：
　　　　 #define add1(a, b) asm("addl %2,%0":"=&r"(res):"0"(a),"r"(b))
　　告诉GCC参作数%0是earlyclobber，不要和%2分配到同一个寄存器，这样add1(a,a)生成指令：
　　　　 movl %eax, %edx
　　　　 #%0=edx, %2=eax
　　　　 #APP
　　　　 incl %edx
　　　　 addl %eax, %edx # edx = output
　　　　 #NO_APP
四、对%quot"限定符的解释
　　 %:说明指令中可与下一操作数交换的那个操作数,这意味着编译可以交换这两个操作数以使得能以代价更小的方法来满足操作数约束,这常常用于真正只有两个操作数的加法指令的指令样板中,这种加法指令的结果必须存放在两个操作数之一中。

阅读(1505) | 评论(0) | 转发(0) |

上一篇：gcc中的内嵌汇编语言（Intel i386平台）(一)

下一篇：linux GCC嵌入汇编语言

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6