GCC 内嵌汇编（上篇）-CUKdd-ChinaUnix博客

cukddcukdd.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

CUKdd

博客访问： 914051
博文数量： 73
博客积分： 2689
博客等级：少校
技术积分： 897
用户组：普通用户
注册时间： 2010-10-07 19:39

个人简介

一个有目标，为自己的未来努力奋斗的人

文章分类

全部博文（73）

学习?生活?创业（2）
Web前端（2）
数据库（2）
PHP（3）
WebServer（1）
分布式存储（5）
高并发网络编程（4）
云计算（4）
软件分析（9）
算法设计（9）
招聘笔试题（1）
编程语言（6）
Linux内核篇（4）
Linux系统应用篇（7）
Tools（5）
软件破解（0）
性能优化（9）
未分配的博文（0）

文章存档

2015年（9）

2014年（2）

2013年（6）

2012年（11）

2011年（33）

2010年（12）

我的朋友

相关博文

GCC 内嵌汇编（上篇）

分类： C/C++

2010-12-02 21:47:32

1 简介

内核代码绝大部分使用 C 语言编写,只有一小部分使用汇编语言编写,例如与特定体系结构相关的代码和对性能影响很大的代码。GCC 提供了内嵌汇编的功能,可以在 C 代码中直接内嵌汇编语言语句,大大方便了程序设计。简单的内嵌汇编很容易理解,例:

__asm__ __volatile__("hlt");

“__asm__” 表示后面的代码为内嵌汇编,“asm”是“__asm__”的别名。

“__volatile__” 表示编译器不要优化代码,后面的指令保留原样,“volatile”是它的别名。括号里面是汇编指令。

2 内嵌汇编举例

在内嵌汇编中,可以将 C 语言表达式指定为汇编指令的操作数,而且不用去管如何将 C语言表达式的值读入哪个寄存器,以及如何将计算结果写回 C 变量,你只要告诉程序中 C语言表达式与汇编指令操作数之间的对应关系即可,GCC 会自动插入代码完成必要的操作。使用内嵌汇编,要先编写汇编指令模板,然后将 C 语言表达式与指令的操作数相关联,并告诉 GCC 对这些操作有哪些限制条件。例如在下面的汇编语句:

__asm__ __violate__ ("movl %1, %0" : "=r" (result) : "r" (input));

“movl %1,%0”是指令模板;

“%0”和“%1”代表指令的操作数,称为占位符,内嵌汇编靠它们将 C 语言表达式与指令操作数相对应。指令模板后面用小括号括起来的是 C 语言表达式,本例中只有两个:

“result”和“input”,他们按照出现的顺序分别与指令操作数“%0”,“%1”对应;注意对应顺序:第一个 C 表达式对应“%0”;第二个表达式对应“%1”,依次类推,操作数至多有 10 个,分别用“%0”“%1”....“%9”表示。在

每个操作数前面有一个用引号括起来的字符串,字符串的内容是对该操作数的限制或者说要求。

“result”前面的限制字符串是“=r”,其中“=”表示“result”是输出操作数,“r”表示需要将“result”与某个通用寄存器相关联,先将操作数的值读入寄存器,然后在指令中使用相应寄存器,而不是“result”本身,当然指令执行完后需要将寄存器中的值存入变量“result”,从表面上看好像是指令直接对“result”进行操作,实际上 GCC 做了隐式处理,这样我们可以少写一些指令。

“input”前面的“r”表示该表达式需要先放入某个寄存器,然后在指令中使用该寄存器参加运算。

我们将上面的内嵌代码放到一个 C 源文件中,然后使用 gcc –c–S 得到该 C 文件源代码相对应的汇编代码,然后查看一下汇编代码,看看 GCC 是如何处理的。C 源文件如下内容如下,注意该代码没有实际意义,仅仅作为例子。

extern int input, result;

void test(void)

{

input = 1;

__asm__ __volatile__ ("movl %1,%0" : "=r" (result) : "r" (input));

return;

}

对应的汇编代码如下:

movl $1, input

movl input, %eax

#APP

movl %eax, %eax

#NO_APP

movl %eax, result

解释：

对应 C 语言语句 input = 1;

#APP：GCC 插入的注释,表示内嵌汇编开始我们的内嵌汇编语句。

#NO_APP：GCC 插入的注释,表示内嵌汇编结束

将结果存入 result 变量

从汇编代码可以看出,第 9 行和第 13 行是 GCC 自动增加的代码,GCC 根据限定字符串决定如何处理 C 表达式,本例两个表达式都被指定为“r”型,所以先使用指令:

movl input, %eax

将 input 读入寄存器%eax;

GCC 也指定一个寄存器与输出变量 result 相关,本例也是%eax,等得到操作结果后再使用指令:

movl %eax, result

将寄存器的值写回 C 变量 result 中。

从上面的汇编代码我们可以看出与 result 和 input,相关连的寄存器都是%eax,GCC 使用%eax 替换内嵌汇编指令模板中的%0,%1。显然 movl %eax,%eax 这一句可以不要。但是没有优化,所以这一句没有被去掉。由此可见,C 表达式或者变量与寄存器的关系由 GCC 自动处理,我们只需使用限制字符串指导 GCC 如何处理即可。限制字符必须与指令对操作数的要求相匹配,否则产生的汇编代码将会有错,读者可以将上例中的两个“r”,都改为“m”(m 表示操作数放在内存,而不是寄存器中),编译后得到的结果是:

movl input, result

很明显这是一条非法指令,因此限制字符串必须与指令对操作数的要求匹配。

例如指令

movl 允许寄存器到寄存器,立即数到寄存器等,但是不允许内存到内存的操作,因此两个操作数不能同时使用“m”作为限定字符。

3 语法

内嵌汇编语法如下:

__asm__(

汇编语句模板:

输出部分:

输入部分:

破坏描述部分)

共四个部分:汇编语句模板,输出部分,输入部分,破坏描述部分,各部分使用“:”格开,汇编语句模板必不可少,其他三部分可选,如果使用了后面的部分,而前面部分为空,也需要用“:”格开,相应部分内容为空。例如:

__asm__ __volatile__(

"cli":

:"memory")

3.1 汇编语句模板

汇编语句模板由汇编语句序列组成,语句之间使用“;”“\n”或“\n\t”分开。指令中的操作数可以使用占位符引用 C 语言变量,操作数占位符最多 10 个,名称如下:

%0,%1...,%9

指令中使用占位符表示的操作数,总被视为 long 型(4 个字节),但对其施加的操作根据指令可以是字或者字节,当把操作数当作字或者字节使用时,默认为低字或者低字节。对字节操作可以显式的指明是低字节还是次字节。方法是在%和序号之间插入一个字母,“b”代表低字节,“h”代表高字节,例如:%h1。

3.2 输出部分

输出部分描述输出操作数,不同的操作数描述符之间用逗号格开,每个操作数描述符由限定字符串和 C 语言变量组成。每个输出操作数的限定字符串必须包含“=”表示它是一个输出操作数。例:

__asm__ __volatile__("pushfl ; popl %0 ; cli":"=g" (x) )

描述符字符串表示对该变量的限制条件,这样 GCC 就可以根据这些条件决定如何分配寄存器,如何产生必要的代码处理指令操作数与 C 表达式或 C 变量之间的联系。

3.3 输入部分

输入部分描述输入操作数,不同的操作数描述符之间使用逗号格开,每个操作数描述符由限定字符串和 C 语言表达式或者 C 语言变量组成。

例 1:

__asm__ __volatile__ ("lidt %0" : : "m" (real_mode_idt));

例 2 (bitops.h)

Static __inline__ void __set_bit(int nr, volatile void * addr)

{

__asm__(

"btsl %1,%0":

"=m"(ADDR):

"Ir"(nr));

}

后例功能是将(*addr)的第 nr 位设为 1。第一个占位符%0 与 C 语言变量 ADDR 对应,第二个占位符%1 与 C 语言变量 nr 对应。因此上面的汇编语句代码与下面的伪代码等价:

btsl nr, ADDR;

该指令的两个操作数不能全是内存变量,因此将 nr 的限定字符串指定为“Ir”,将 nr,与立即数或者寄存器相关联,这样两个操作数中只有 ADDR 为内存变量。

3.4 限制字符

接下篇...

阅读(1085) | 评论(1) | 转发(0) |

上一篇：在x86_32环境下编译x86_64linux内核（上篇）

下一篇：GCC 内嵌汇编（中篇）

给主人留下些什么吧！~~

chinaunix网友2010-12-03 15:14:07

很好的, 收藏了推荐一个博客，提供很多免费软件编程电子书下载： http://free-ebooks.appspot.com

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6