AT&T汇编与Intel汇编的比较-RealAMD-ChinaUnix博客

章鱼的窝

首页　| 　博文目录　| 　关于我

RealAMD

博客访问： 1976554
博文数量： 261
博客积分： 8073
博客等级：中将
技术积分： 2363
用户组：普通用户
注册时间： 2006-04-10 15:23

文章分类

全部博文（261）

ICE（4）
ACE（1）
Linux系统性能优（1）
Linux内存管理（3）
美食（1）
Understaning in （0）
算法导论读书笔记（3）
我的日记本（31）
IDE工具（0）
J2ME（2）
RFID（2）
社会经济（4）
休闲娱乐（1）
嵌入式Linux系统（71）

我的日记（14）

uclinux（1）

基础知识（5）

GUI相关（6）

数据库相关（1）

软件相关（0）

硬件相关（8）

BootLoader相关（2）

仿真工具（3）

程序相关（10）

文件系统相关（5）

内核相关（14）
操作系统（21）

windows（0）

Linux（21）
手机相关（5）
编程语言（13）

C++（3）

JSP（2）

QT（3）

JAVA（5）
电子商务（0）
未分配的博文（98）

文章存档

2013年（1）

2012年（1）

2011年（50）

2010年（34）

2009年（4）

2008年（17）

2007年（55）

2006年（99）

我的朋友

最近访客

推荐博文

AT&T汇编与Intel汇编的比较

分类：

2006-04-15 09:52:54

gcc采用的是AT&T的汇编格式,MS采用Intel的汇编格式.

一　基本语法

语法上主要有以下几个不同.

1、寄存器命名原则

AT&T: %eax

Intel: eax

2、源/目的操作数顺序

AT&T: movl %eax,%ebx

Intel: mov ebx,eax

3、常数/立即数的格式

AT&T: movl $_value,%ebx

Intel: mov eax,_value

把_value的地址放入eax寄存器

AT&T: movl $0xd00d,%ebx

Intel: mov ebx,0xd00d

4、操作数长度标识

AT&T: movw %ax,%bx

Intel: mov bx,ax

5、寻址方式

AT&T: immed32(basepointer,indexpointer,indexscale)

Intel: [basepointer + indexpointer*indexscale + imm32)

Linux工作于保护模式下，用的是３２位线性地址，所以在计算地址时不用考虑segment

ffset的问题．上式中的地址应为：

imm32 + basepointer + indexpointer*indexscale

下面是一些例子：

1、直接寻址

AT&T: _booga　; _booga是一个全局的C变量

注意加上$是表示地址引用，不加是表示值引用.

注：对于局部变量，可以通过堆栈指针引用．

Intel: [_booga]

2、寄存器间接寻址

AT&T: (%eax)

Intel: [eax]

3、变址寻址

AT&T: _variable(%eax)

Intel: [eax + _variable]

AT&T: _array(,%eax,4)

Intel: [eax*4 + _array]

AT&T: _array(%ebx,%eax,8)

Intel: [ebx + eax*8 + _array]

二　基本的行内汇编

基本的行内汇编很简单，一般是按照下面的格式

asm("statements");

例如：

asm("nop");

asm("cli");

asm　和　__asm__是完全一样的．

如果有多行汇编，则每一行都要加上　"\n\t"

例如：

asm( "pushl %eax\n\t"

"movl $0,%eax\n\t"

"popl %eax");

实际上gcc在处理汇编时，是要把asm(...)的内容"打印"到汇编文件中，所以格式控制字符是必要的．

再例如：

asm("movl %eax,%ebx");

asm("xorl %ebx,%edx");

asm("movl $0,_booga);

在上面的例子中，由于我们在行内汇编中改变了edx和ebx的值，但是由于gcc的特殊的处理方法，即先形成汇编文件，再交给GAS去汇编，所以GAS并不知道我们已经改变了edx和ebx的值，如果程序的上下文需要edx或ebx作暂存，这样就会引起严重的后果．对于变量_booga也存在一样的问题．为了解决这个问题，就要用到扩展的行内汇编语法．

三　扩展的行内汇编

扩展的行内汇编类似于Watcom.

基本的格式是：

asm ( "statements" : output_regs : input_regs : clobbered_regs);

clobbered_regs指的是被改变的寄存器．

下面是一个例子(为方便起见，我使用全局变量）：

int count=1;

int value=1;

int buf[10];

void main()
{
asm(

"cld \n\t"

"rep \n\t"

"stosl":: "c" (count), "a" (value) , "D" (buf[0]): "%ecx","%edi" );

}

得到的主要汇编代码为：

movl count,%ecx

movl value,%eax

movl buf,%edi

#APP

cld

rep

stosl

#NO_APP

cld,rep,stos就不用多解释了．这几条语句的功能是向buf中写上count个value值．冒号后的语句指明输入，输出和被改变的寄存器．通过冒号以后的语句，编译器就知道你的指令需要和改变哪些寄存器，从而可以优化寄存器的分配．其中符号"c"(count)指示要把count的值放入ecx寄存器

类似的还有：

a eax

b ebx

c ecx

d edx

S esi

D edi

I 常数值，(0 - 31)

q,r 动态分配的寄存器

g eax,ebx,ecx,edx或内存变量

A 把eax和edx合成一个64位的寄存器(use long longs)

我们也可以让gcc自己选择合适的寄存器．如下面的例子：

asm("leal (%1,%1,4),%0"

: "=r" (x)

: "0" (x) );

这段代码实现5*x的快速乘法．

得到的主要汇编代码为：

movl x,%eax

#APP

leal (%eax,%eax,4),%eax

#NO_APP

movl %eax,x

几点说明：

1.使用q指示编译器从eax,ebx,ecx,edx分配寄存器．使用r指示编译器从eax,ebx,ecx,edx,esi,edi分配寄存器．

2.我们不必把编译器分配的寄存器放入改变的寄存器列表，因为寄存器已经记住了它们．

3."="是标示输出寄存器，必须这样用．

4.数字%n的用法：数字表示的寄存器是按照出现和从左到右的顺序映射到用"r"或"q"请求的寄存器．如果我们要重用"r"或"q"请求的寄存器的话，就可以使用它们．

5.如果强制使用固定的寄存器的话，如不用%1,而用ebx,则

asm("leal (%%ebx,%%ebx,4),%0"

: "=r" (x)

: "0" (x) );

注意要使用两个%,因为一个%的语法已经被%n用掉了．

下面可以来解释letter 4854-4855的问题：

1、变量加下划线和双下划线有什么特殊含义吗？加下划线是指全局变量，但我的gcc中加不加都无所谓．

2、以上定义用如下调用时展开会是什么意思？

#define _syscall1(type,name,type1,arg1) \

type name(type1 arg1) \

{ \

long __res; \

/* __res应该是一个全局变量　*/

__asm__ volatile ("int $0x80" \

/* volatile 的意思是不允许优化，使编译器严格按照你的汇编代码汇编*/

: "=a" (__res) \

/* 产生代码　movl %eax, __res */

: "0" (__NR_##name),"b" ((long)(arg1))); \

/* 如果我没记错的话，这里##指的是两次宏展开．

　　即用实际的系统调用名字代替"name",然后再把__NR_...展开．

　　接着把展开的常数放入eax，把arg1放入ebx */

if (__res >= 0) \

return (type) __res; \

errno = -__res; \

return -1; \

}

阅读(1025) | 评论(0) | 转发(0) |

上一篇：gcc中的内嵌汇编语言

下一篇：gcc中的内嵌汇编语言(Intel i386平台)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6