AT & T汇编简介 --转载自ＣＳＤＮ黄杰的ＢＬＯＧ-kanghtta-ChinaUnix博客

只记今朝kang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

kanghtta

博客访问： 1840247
博文数量： 290
博客积分： 10653
博客等级：上将
技术积分： 3178
用户组：普通用户
注册时间： 2007-10-24 23:08

文章分类

全部博文（290）

Python（3）
Exploit（0）
Android（0）
文件格式（1）
QT编程（4）
调试器（2）

dbg（1）

IDA（0）

OllyIce（0）

windbg（1）
Linux内核分析（13）

系统引导（11）
模式匹配（0）
驱动开发技术（4）

驱动开发相关资料（0）

学习笔记（1）

WDK文档（1）
工具使用（10）
源代码阅读（19）

grub源代码（2）

Service（8）

CRT（4）

Visual C++（3）

汇编（1）
WWW程序设计（1）

服务器（0）

JavaScript（0）

PHP（0）

CSS（0）

HTML（0）
Visual C++ SDK （17）
经典视频收集（13）
Shell Code揭秘（2）
诗词歌赋赏析（0）
读书（1）
英语学习（4）

新概念英语（0）

第四册（0）

第三册（0）

第二册（2）

第一册（0）

介词用法总结（1）

新视野大学英语（0）
经典文章转载（44）
系统优化与网络安（14）
心情日记（18）
计算机体系结构相（2）
linux学习（26）
操作系统-WINDOWS（10）
计算机网络（15）

网络流媒体协议标（0）

RFC文档（2）

Network Programm（6）
反汇编与加密解密（9）

PackKer（1）
汇编语言程序设计（29）
数据库技术（3）

Sql和高级语言的（1）

SQl server 2000（0）
数据结构与语言学（26）

逆向C++（1）

算法与数据结构（4）

java 程序设计（1）

C++语言基础（17）

C++现代大学教程（3）
未分配的博文（0）

文章存档

2013年（6）

2012年（15）

2011年（25）

2010年（86）

2009年（52）

2008年（66）

2007年（40）

我的朋友

相关博文

AT & T汇编简介 --转载自ＣＳＤＮ黄杰的ＢＬＯＧ

分类： LINUX

2007-10-30 22:33:20

今天开始分析内核，可是一上路就来了坎坷啊　，汇编指令我没见过，只有上网搜了，一下就搜到这个，觉得还不错，故转过来放这里为了方便自己以后学习用，各位朋友有兴趣转载的请说明来处，每位写东西的作者不管是因为什么原因写，我都觉得应该尊重一下，毕竟，他没把学到的东西放在肚子里，而是拿出来大家共同分享，共同进步．　哈（废话连篇，还是言归正转）哎　汗．．．．

1.寄存器引用引用寄存器要在寄存器号前加百分号%,如“movl %eax, %ebx”。

80386有如下寄存器： 8个32-bit寄存器 %eax，%ebx，%ecx，%edx，%edi，%esi，%ebp，%esp；

8个16-bit寄存器，它们事实上是上面8个32-bit寄存器的低16位：%ax，%bx，%cx，%dx，%di，%si，bp，% sp； 8个8-bit寄存器：%ah，%al，%bh，%bl，%ch，%cl，%dh，%dl。它们事实上是寄存器%ax，%bx，%cx，%dx的高8位和低8位；

6个段寄存器：%cs(code)，%ds(data)，%ss(stack), %es，%fs，%gs；

3个控制寄存器：%cr0，%cr2，%cr3；

6个debug寄存器：%db0，%db1，%db2，%db3，%db6，%db7；

2个测试寄存器：%tr6，%tr7；

8个浮点寄存器栈：%st(0)，%st(1)，%st(2)，%st(3)，%st(4)，%st(5)，%st(6)，%st(7)。

2. 操作数顺序操作数排列是从源（左）到目的（右），如“movl %eax(源）, %ebx(目的）”

3. 立即数使用立即数，要在数前面加符号$,

如“movl $0x04, %ebx” 或者： para = 0x04 movl $para, %ebx

指令执行的结果是将立即数04h装入寄存器ebx。

4. 符号常数符号常数直接引用

如 value: .long 0x12a3f2de

movl value , %ebx

指令执行的结果是将常数0x12a3f2de装入寄存器ebx。

引用符号地址在符号前加符号$,

如“movl $value, % ebx”则是将符号value的地址装入寄存器ebx。

5. 操作数的长度操作数的长度用加在指令后的符号表示b(byte, 8-bit), w(word, 16-bits), l(long, 32-bits)，

如“movb %al, %bl”，“movw %ax, %bx”，“movl %eax, %ebx ”。

如果没有指定操作数长度的话，编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”，由于目标操作数bx的长度为word，那么编译器将把此指令等同于“movw %ax, %bx”。同样道理，指令“mov $4, %ebx”等同于指令“movl $4, %ebx”，

“push %al”等同于“pushb %al”。对于没有指定操作数长度，但编译器又无法猜测的指令，编译器将会报错，比如指令“push $4”。

6. 符号扩展和零扩展指令

绝大多数面向80386的AT&T汇编指令与Intel格式的汇编指令都是相同的，符号扩展指令和零扩展指令则是仅有的不同格式指令。

符号扩展指令和零扩展指令需要指定源操作数长度和目的操作数长度，即使在某些指令中这些操作数是隐含的。

在AT&T语法中，符号扩展和零扩展指令的格式为，基本部分"movs"和"movz"（对应Intel语法的movsx和movzx），后面跟上源操作数长度和目的操作数长度。

movsbl意味着movs （from）byte （to）long；

movbw意味着movs （from）byte （to）word；

movswl意味着movs （from）word （to）long。

对于movz指令也一样。比如指令“movsbl %al, %edx”

意味着将al寄存器的内容进行符号扩展后放置到edx寄存器中。其它的Intel格式的符号扩展指令还有： cbw -- sign-extend byte in %al to word in %ax；

cwde -- sign-extend word in %ax to long in %eax；

cwd -- sign-extend word in %ax to long in %dx:%ax；

cdq -- sign-extend dword in %eax to quad in %edx:%eax；

对应的AT&T语法的指令为cbtw，cwtl，cwtd，cltd。

7. 调用和跳转指令段内调用和跳转指令为"call"，"ret"和"jmp"

，段间调用和跳转指令为"lcall"，"lret"和"ljmp"。

段间调用和跳转指令的格式为“lcall/ljmp $SECTION, $OFFSET”，

而段间返回指令则为“lret $STACK-ADJUST”。

8. 前缀操作码前缀被用在下列的情况：

字符串重复操作指令(rep,repne)；

指定被操作的段(cs,ds,ss,es,fs,gs)；

进行总线加锁(lock)；

指定地址和操作的大小(data16,addr16)；

在AT&T汇编语法中，操作码前缀通常被单独放在一行，后面不跟任何操作数。

例如，对于重复scas指令，其写法为： repne scas 上述操作码前缀的意义和用法如下：

指定被操作的段前缀为cs,ds,ss,es,fs,和gs

。在AT&T语法中，只需要按照section:memory-operand的格式就指定了相应的段前缀。比如：lcall %cs:realmode_swtch 操作数／地址大小前缀是“data16”和"addr16"，它们被用来在32-bit操作数／地址代码中指定16-bit的操作数／地址。总线加锁前缀“lock”，它是为了在多处理器环境中，保证在当前指令执行期间禁止一切中断。这个前缀仅仅对ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG,DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD,XCHG指令有效，如果将Lock前缀用在其它指令之前，将会引起异常。字符串重复操作前缀"rep","repe","repne"用来让字符串操作重复“%ecx”次。

9. 内存引用 Intel语法的间接内存引用的格式为：

section:[base+index*scale+displacement]

而在AT&T语法中对应的形式为： section:displacement(base,index,scale) 其中，base和index是任意的32-bit base和index寄存器。scale可以取值1，2，4，8。

如果不指定scale值，则默认值为1。section可以指定任意的段寄存器作为段前缀，默认的段寄存器在不同的情况下不一样。如果你在指令中指定了默认的段前缀，则编译器在目标代码中不会产生此段前缀代码。

下面是一些例子：

-4(%ebp)：base=%ebp，displacement=-4，section没有指定，

由于base＝%ebp，所以默认的section=%ss，index,scale没有指定，则index为0。

foo(,%eax,4)：index=%eax，scale=4，displacement=foo。其它域没有指定。

这里默认的section=%ds。 foo(,1)：

这个表达式引用的是指针foo指向的地址所存放的值。注意这个表达式中没有base和index，并且只有一个逗号，这是一种异常语法，但却合法。 %gs:foo：这个表达式引用的是放置于%gs段里变量foo的值。

如果call和jump操作在操作数前指定前缀“*”，则表示是一个绝对地址调用/跳转，也就是说jmp/call指令指定的是一个绝对地址。如果没有指定"*"，则操作数是一个相对地址。任何指令如果其操作数是一个内存操作，则指令必须指定它的操作尺寸(byte,word,long），也就是说必须带有指令后缀(b,w,l)。

二　基本的行内汇编基本的行内汇编很简单，一般是按照下面的格式 asm("statements"); 例如：asm("nop"); asm("cli"); asm　和　__asm__是完全一样的．如果有多行汇编，则每一行都要加上　"\n\t" 例如： asm( "pushl % eax\n\t" "movl $0,% eax\n\t" "popl % eax"); 实际上gcc在处理汇编时，是要把asm(...)的内容"打印"到汇编文件中，所以格式控制字符是必要的．

再例如： asm("movl % eax,% ebx"); asm("xorl % ebx,% edx"); asm("movl $0,_booga); 在上面的例子中，由于我们在行内汇编中改变了edx和ebx的值，但是由于gcc的特殊的处理方法，即先形成汇编文件，再交给GAS去汇编，所以GAS并不知道我们已经改变了edx和ebx的值，如果程序的上下文需要edx或ebx作暂存，这样就会引起严重的后果．

对于变量_booga也存在一样的问题．为了解决这个问题，就要用到扩展的行内汇编语法．三　扩展的行内汇编基本的格式是： asm( statements : outputs : inputs : registers-modified); statements是一些汇编语句，outputs是输出寄存器，inputs是输入寄存器，registers-modified 是在这个过程中改变的寄存器。

例如： int i=0, j=1, k=0; __asm__ __volatile__(" pushl %% eax\n movl %1, %% eax\n addl %2, %% eax\n movl %% eax, %0\n popl %% eax" : "=g" (k) : "g" (i), "g" (j) ); // k = i + j 在上面的这段代码中，输入寄存器用了"g"限定符，它的意思是将输入变量放入 eax,ebx,ecx,edx或内存变量其中之一，类似的限定还有： "a" eax "b" ebx "c" ecx "d" edx "S" esi "D" edi "q" 从eax,ebx,ecx,edx分配寄存器 "r" 从eax,ebx,ecx,edx,esi,edi分配寄存器 "g" eax,ebx,ecx,edx或内存变量 "A" 把eax和edx合成一个64位的寄存器(use long longs) "I" I是常数值，

例如"1",它是把输出寄存器和输入寄存器由左到右，由上到下顺序往下数对应的寄存器在上面这段代码中,%0对应k存放的寄存器,,%1对应i存放的寄存器，%2对应j存放的寄存器. "i" 立即数 "m" 内存变量输出寄存器要在前面加"=",指示输出的位置。

上面的代码展开大概是： mov i, % eax mov j, % ebx pushl %% eax movl % eax, %% eax movl % ebx, %% eax movl %% eax, % ecx popl %% eax

又如： do { \ int __d0, __d1; \ __asm__ __volatile__ ("movw %%dx,%%ax\n\t" \ "movw %4,%%dx\n\t" \ "movl %% eax,%0\n\t" \ "movl %% edx,%1" \ :"=m" (*((long *) (gate_addr))), \ "=m" (*(1+(long *) (gate_addr))), "=&a" (__d0), "=&d" (__d1) \ :"i" ((short) (0x8000+(dpl<<13)+(type<<8))), \ "3" ((char *) (addr)),"2" (__KERNEL_CS << 16)); \ } while (0)

中 %3 对应edx, %2对应eax, %1是(*(1+(long *) (gate_addr))). 这段代码是将中断处理函数的地址填到 ldt(中断向量表)中。

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=608908

阅读(1428) | 评论(0) | 转发(0) |

上一篇：WINDOWS窗口过程的反汇编代码分析

下一篇：转　一位软件工程师的6年总结－来自ＣＳＤＮ

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6