GCC采用的是AT&T的汇编格式, 也叫GAS格式(Gnu ASembler GNU汇编器), 而微软采用Intel的汇编格式.
一 基本语法
语法上主要有以下几个不同.
1、寄存器命名原则
AT&T | Intel | 说明 |
%eax | eax | Intel的不带百分号 |
2、源/目的操作数顺序
AT&T | Intel | 说明 |
movl %eax, %ebx | mov ebx, eax | Intel的目的操作数在前,源操作数在后 |
3、常数/立即数的格式
AT&T | Intel | 说明 |
movl $_value,%ebx | mov eax,_value | Intel的立即数前面不带$符号 |
movl $0xd00d,%ebx | mov ebx,0xd00d | 规则同样适用于16进制的立即数 |
4、操作数长度标识
AT&T | Intel | 说明 |
movw %ax,%bx | mov bx,ax | Intel的汇编中, 操作数的长度并不通过指令符号来标识 |
在AT&T的格式中, 每个操作都有一个字符后缀, 表明操作数的大小. 例如:mov指令有三种形式:
movb 传送字节
movw 传送字
movl 传送双字
因为在许多机器上, 32位数都称为长字(long word), 这是沿用以16位字为标准的时代的历史习惯造成的.
果没有指定操作数长度的话,编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”,由于目标操作数bx的长度为word,那么编译器将把此指令等同于“movw %ax, %bx”。同样道理,指令“mov $4, %ebx”等同于指令“movl $4, %ebx”,“push %al”等同于“pushb %al”。对于没有指定操作数长度,但编译器又无法猜测的指令,编译器将会报错,比如指令“push $4”。
5、寻址方式
AT&T | Intel |
imm32(basepointer,indexpointer,indexscale) | [basepointer + indexpointer*indexscale + imm32) |
两种寻址的实际结果都应该是
imm32 + basepointer + indexpointer*indexscale
例如: 下面是一些寻址的例子:
AT&T: `-4(%ebp)' 相当于 Intel: `[ebp - 4]'
AT&T: `foo(,%eax,4)' 相当于 Intel: `[foo + eax*4]'
AT&T: `foo(,1)' 相当于 Intel `[foo]'
AT&T: `%gs:foo' 相当于 Intel`gs:foo'
AT&T: movl -4(%ebp), %eax 相当于 Intel: mov eax, [ebp - 4]
AT&T:movl array(, %eax, 4), %eax 相当于 Intel: mov eax, [eax*4 + array]
AT&T:movw array(%ebx, %eax, 4), %cx 相当于 Intel: mov cx, [ebx + 4*eax + array]
AT&T:movb $4, %fs:(%eax) 相当于 Intel: mov fs:eax, 4
6.跳转方式
6.1在 AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。
AT&T:
jmp *%eax 用寄存器%eax中的值作为跳转目标
jmp *(%eax) 以%eax中的值作为读入的地址, 从存储器中读出跳转目标
Intel:不需要*作为前缀
jmp %eax
jmp (%eax)
6.2远程转移指令和远程子调用指令的操作码,在 AT&T 汇编格式中为 "ljump" 和 "lcall",而在 Intel 汇编格式中则为 "jmp far" 和 "call far",即:
AT&T:
ljump $section, $offset
lcall $section, $offset
Intel:
jmp far section:offset
call far section:offset