Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1176563
  • 博文数量: 573
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 66
  • 用 户 组: 普通用户
  • 注册时间: 2016-06-28 16:21
文章分类

全部博文(573)

文章存档

2018年(3)

2016年(48)

2015年(522)

分类: 嵌入式

2015-12-09 18:44:51

     

反汇编引擎的目的就是要把机器码翻译成汇编语言的格式,主要的汇编格式有Intel格式、AT&T格式,一般在window环境中使用的大多数都是intel格式的汇编语言。这里从官方手册的介绍中总体介绍这两部分的内容,只有知道机器码的格式,汇编指令的格式,才能在其上架起一座桥梁汇编或反汇编。这里我们习惯称汇编指令为Intruction operand,而称机器码为Intruction Opcode。      1.1 Intel汇编格式(Instruction operand)     在官方手册中intel汇编有着固定的格式:     label: mnemonic argument1, argument2, argument3          (1) lable:标签,表面意思就是这条指令的一个指代,实际代表着这条指令在内存中的起始位置。     (2) 助记符:用英语代表机器码的操作,汇编器会根据这个助记符寻找合适的机器码。     (3) argument1, argument2, argument3:实际上intel指令最多也只有三个操作码,当只有两个操作码的时候,第一个为目标操作码,第二个为源操作码。 1.2 intel机器码格式(Instruction Opcode)      汇编语言的格式反映了机器码的编码格式,直观地看,只要给汇编代码的每个部分都分配相应的字节就行了,例如:mnemonic两个字节,argument1-3分别4个字节,这样汇编语言与机器码之间真的就是直接对应的关系了,在这两个部分转换至需要维持一张简单的表就行了。但实际上,intel的指令体系为复杂指令系统(CISC),它这里的复杂绝非浪得虚名,由于以往的机器上内存是个很昂贵的设备,因此,intel的指令编码尽可能地利用了每一个bit,再加上兼容性的考虑,使得整个intel指令结构异常复杂。远远不是一个部分和另一个部分简单的映射那么简单。      物理上,CPU的逻辑运算单元只操作计算机中的两个对象:寄存器和内存。只要给每个寄存器一个编码,那么寄存器的辨别就很容易了,但是内存呢?物理上,内存是个一维的存储单元阵列,逻辑上内存被分成段,页之类的格式,要操作内存,那么指令就要给出操作内存的哪个(哪些)存储单元,这里“哪”指的是寻址模式,这里的“些”和“个”是指要操作的内存的大小,byte, word, dword……。除了这两个操作对象之外,还有一种对象,那就是立即数(immediate),物理上指令执行时,这个数字是在CPU中的,也就是CPU取得的指令中,这个数就已经在那里了。所有的指令编码都是围绕着这三个操作对象进行的,不同的是立即数不需要去找,寄存器简单的编码就行了,而内存不但需要指出其位置,还要指出其大小。此外,还有一些辅助的操作说明,比如是否重复一些操作等等。      看一下intel的确切的指令格式:            prefix部分是指令操作的一些辅助说明,如果先不看prefix部分,其他部分的表面涵义是很明确的:opcode编码了进行什么样的操作,跟汇编格式里面的mnemonic对应,CPU知道了什么操作之后就会寻找操作的对象,是寄存器还是内存?ModR/M部分就给出了操作的对象,R是register,M是memory,而Mod指示了到底是寄存器还是内存。如果ModR/M的字节数足够大的话,那么或许就不需要后面的两个部分了,实际上ModR/M只有一个字节,能编码所有的寄存器,却不能编码所有的内存寻址模式,intel使用后面两个部分来辅助ModR/M完成确切的内存定位SIB和displacement。寻址方式跟CPU对内存的管理密切相关,intel的寻址方式很多,但全部都编码到了SIB和displacement之中。这部分到SIB部分再详细介绍。内存寻址后面就跟了最后一个操作对象Immediate。      指令编码的整个结构还是很清楚的,但也可以看到,每一个部分都有小的子结构,代表着不同的涵义。反汇编就是要读懂机器码的每个部分,然后翻译成汇编格式。在后面的各个部分将把我对各个部分的了解都写出来。


 
	

Intel 汇编指令手册

一、数据传输指令   它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据.   1. 通用数据传送指令.     MOV  传送字或字节.     MOVSX 先符号扩展,再传送.     MOVZX 先零扩展,再传送.     PUSH  把字压入堆栈.     POP  把字弹出堆栈.     PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈.     POPA  把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈.     PUSHAD 把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈.     POPAD 把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈.     BSWAP 交换32位寄存器里字节的顺序     XCHG  交换字或字节.( 至少有一个操作数为寄存器,段寄存器不可作为操作数)     CMPXCHG 比较并交换操作数.( 第二个操作数必须为累加器AL/AX/EAX )     XADD  先交换再累加.( 结果在第一个操作数里 )     XLAT  字节查表转换.         ── BX 指向一张 256 字节的表的起点, AL 为表的索引值 (0-255,即         0-FFH); 返回 AL 为查表结果. ( [BX+AL]->AL )   2. 输入输出端口传送指令.     IN   I/O端口输入. ( 语法: IN 累加器, {端口号│DX} )     OUT  I/O端口输出. ( 语法: OUT {端口号│DX},累加器 )      输入输出端口由立即方式指定时, 其范围是 0-255; 由寄存器 DX 指定时,      其范围是 0-65535.   3. 目的地址传送指令.     LEA  装入有效地址.      例: LEA DX,string ;把偏移地址存到DX.     LDS  传送目标指针,把指针内容装入DS.      例: LDS SI,string ;把段地址:偏移地址存到DS:SI.     LES  传送目标指针,把指针内容装入ES.      例: LES DI,string ;把段地址:偏移地址存到ES:DI.     LFS  传送目标指针,把指针内容装入FS.      例: LFS DI,string ;把段地址:偏移地址存到FS:DI.     LGS  传送目标指针,把指针内容装入GS.      例: LGS DI,string ;把段地址:偏移地址存到GS:DI.     LSS  传送目标指针,把指针内容装入SS.      例: LSS DI,string ;把段地址:偏移地址存到SS:DI.   4. 标志传送指令.     LAHF  标志寄存器传送,把标志装入AH.     SAHF  标志寄存器传送,把AH内容装入标志寄存器.     PUSHF 标志入栈.     POPF  标志出栈.     PUSHD 32位标志入栈.     POPD  32位标志出栈.  二、算术运算指令     ADD  加法.     ADC  带进位加法.     INC  加 1.     AAA  加法的ASCII码调整.     DAA  加法的十进制调整.     SUB  减法.     SBB  带借位减法.     DEC  减 1.     NEC  求反(以 0 减之).     CMP  比较.(两操作数作减法,仅修改标志位,不回送结果).     AAS  减法的ASCII码调整.     DAS  减法的十进制调整.     MUL  无符号乘法.     IMUL  整数乘法.      以上两条,结果回送AH和AL(字节运算),或DX和AX(字运算),     AAM  乘法的ASCII码调整.     DIV  无符号除法.     IDIV  整数除法.      以上两条,结果回送:        商回送AL,余数回送AH, (字节运算);      或 商回送AX,余数回送DX, (字运算).     AAD  除法的ASCII码调整.     CBW  字节转换为字. (把AL中字节的符号扩展到AH中去)     CWD  字转换为双字. (把AX中的字的符号扩展到DX中去)     CWDE  字转换为双字. (把AX中的字符号扩展到EAX中去)     CDQ  双字扩展.  (把EAX中的字的符号扩展到EDX中去) 三、逻辑运算指令       AND  与运算.     OR   或运算.     XOR  异或运算.     NOT  取反.     TEST  测试.(两操作数作与运算,仅修改标志位,不回送结果).     SHL  逻辑左移.     SAL  算术左移.(=SHL)     SHR  逻辑右移.     SAR  算术右移.(=SHR)     ROL  循环左移.     ROR  循环右移.     RCL  通过进位的循环左移.     RCR  通过进位的循环右移.      以上八种移位指令,其移位次数可达255次.        移位一次时, 可直接用操作码. 如 SHL AX,1.        移位>1次时, 则由寄存器CL给出移位次数.         如 MOV CL,04           SHL AX,CL 四、串指令                 DS:SI 源串段寄存器 :源串变址.       ES:DI 目标串段寄存器:目标串变址.       CX   重复次数计数器.       AL/AX 扫描值.       D标志 0表示重复操作中SI和DI应自动增量; 1表示应自动减量.       Z标志 用来控制扫描或比较操作的结束.     MOVS  串传送.       ( MOVSB 传送字符.  MOVSW 传送字.  MOVSD 传送双字. )     CMPS  串比较.       ( CMPSB 比较字符.  CMPSW 比较字. )     SCAS  串扫描.       把AL或AX的内容与目标串作比较,比较结果反映在标志位.     LODS  装入串.       把源串中的元素(字或字节)逐一装入AL或AX中.       ( LODSB 传送字符.  LODSW 传送字.  LODSD 传送双字. )     STOS  保存串.       是LODS的逆过程.     REP      当CX/ECX0时重复.     REPE/REPZ   当ZF=1或比较结果相等,且CX/ECX0时重复.     REPNE/REPNZ  当ZF=0或比较结果不相等,且CX/ECX0时重复.     REPC     当CF=1且CX/ECX0时重复.     REPNC     当CF=0且CX/ECX0时重复. 五、程序转移指令   1>无条件转移指令 (长转移)     JMP  无条件转移指令     CALL  过程调用     RET/RETF过程返回.   2>条件转移指令 (短转移,-128到+127的距离内)     ( 当且仅当(SF XOR OF)=1时,OP1循环控制指令(短转移)     LOOP      CX不为零时循环.     LOOPE/LOOPZ  CX不为零且标志Z=1时循环.     LOOPNE/LOOPNZ CX不为零且标志Z=0时循环.     JCXZ      CX为零时转移.     JECXZ     ECX为零时转移.   4>中断指令     INT  中断指令     INTO  溢出中断     IRET  中断返回   5>处理器控制指令     HLT  处理器暂停, 直到出现中断或复位信号才继续.     WAIT  当芯片引线TEST为高电平时使CPU进入等待状态.     ESC  转换到外处理器.     LOCK  封锁总线.     NOP  空操作.     STC  置进位标志位.     CLC  清进位标志位.     CMC  进位标志取反.     STD  置方向标志位.     CLD  清方向标志位.     STI  置中断允许位.     CLI  清中断允许位. 六、伪指令             DW   定义字(2字节).     PROC  定义过程.     ENDP  过程结束.     SEGMENT 定义段.     ASSUME 建立段寄存器寻址.     ENDS  段结束.     END  程序结束. 

8086/80186/80286/80386/80486Instruction Set

     AAA - Ascii Adjust for Addition

     AAD - Ascii Adjust for Division

     AAM - Ascii Adjust for Multiplication

     AAS - Ascii Adjust for Subtraction

     ADC - Add With Carry

     ADD - Arithmetic Addition

     AND - Logical And

     ARPL - Adjusted Requested Privilege Levelof Selector (286+ PM)

     BOUND - Array Index Bound Check (80188+)

     BSF - Bit Scan Forward (386+)

     BSR - Bit Scan Reverse  (386+)

     BSWAP - Byte Swap       (486+)

     BT - Bit Test           (386+)

     BTC - Bit Test with Compliment (386+)

     BTR - Bit Test with Reset (386+)

     BTS - Bit Test and Set  (386+)

     CALL - Procedure Call

     CBW - Convert Byte to Word

     CDQ - Convert Double to Quad (386+)

     CLC - Clear Carry

     CLD - Clear Direction Flag

     CLI - Clear Interrupt Flag (disable)

     CLTS - Clear Task Switched Flag (286+privileged)

     CMC - Complement Carry Flag

     CMP - Compare

     CMPS - Compare String (Byte, Word orDoubleword)

     CMPXCHG - Compare and Exchange

     CWD - Convert Word to Doubleword

     CWDE - Convert Word to Extended Doubleword(386+)

     DAA - Decimal Adjust for Addition

     DAS - Decimal Adjust for Subtraction

     DEC - Decrement

     DIV - Divide

     ENTER - Make Stack Frame (80188+)

     ESC - Escape

     HLT - Halt CPU

     IDIV - Signed Integer Division

     IMUL - Signed Multiply

     IN - Input Byte or Word From Port

     INC - Increment

     INS - Input String from Port (80188+)

     INT - Interrupt

     INTO - Interrupt on Overflow

     INVD - Invalidate Cache  (486+)

     INVLPG - Invalidate Translation Look-AsideBuffer Entry (486+)

     IRET/IRETD - Interrupt Return

     Jxx - Jump Instructions Table

     JCXZ/JECXZ - Jump if Register (E)CX isZero

     JMP - Unconditional Jump

     LAHF - Load Register AH From Flags

     LAR - Load Access Rights (286+ protected)

     LDS - Load Pointer Using DS

     LEA - Load Effective Address

     LEAVE - Restore Stack for Procedure Exit(80188+)

     LES - Load Pointer Using ES

     LFS - Load Pointer Using FS (386+)

     LGDT - Load Global Descriptor Table (286+privileged)

     LIDT - Load Interrupt Descriptor Table(286+ privileged)

     LGS - Load Pointer Using GS (386+)

     LLDT - Load Local Descriptor Table (286+privileged)

     LMSW - Load Machine Status Word (286+privileged)

     LOCK - Lock Bus

     LODS - Load String (Byte, Word or Double)

     LOOP - Decrement CX and Loop if CX NotZero

     LOOPE/LOOPZ - Loop While Equal / LoopWhile Zero

     LOOPNZ/LOOPNE - Loop While Not Zero / LoopWhile Not Equal

     LSL - Load Segment Limit (286+ protected)

     LSS - Load Pointer Using SS (386+)

     LTR - Load Task Register (286+ privileged)

     MOV - Move Byte or Word

     MOVS - Move String (Byte or Word)

     MOVSX - Move with Sign Extend (386+)

     MOVZX - Move with Zero Extend (386+)

     MUL - Unsigned Multiply

     NEG - Two's Complement Negation

     NOP - No Operation (90h)

     NOT - One's Compliment Negation (LogicalNOT)

     OR - Inclusive Logical OR

     OUT - Output Data to Port

     OUTS - Output String to Port (80188+)

     POP - Pop Word off Stack

     POPA/POPAD - Pop All Registers onto Stack(80188+)

     POPF/POPFD - Pop Flags off Stack

     PUSH - Push Word onto Stack

     PUSHA/PUSHAD - Push All Registers ontoStack (80188+)

     PUSHF/PUSHFD - Push Flags onto Stack

     RCL - Rotate Through Carry Left

     RCR - Rotate Through Carry Right

     REP - Repeat String Operation

     REPE/REPZ - Repeat Equal / Repeat Zero

     REPNE/REPNZ - Repeat Not Equal / RepeatNot Zero

     RET/RETF - Return From Procedure

     ROL - Rotate Left

     ROR - Rotate Right

     SAHF - Store AH Register into FLAGS

     SAL/SHL - Shift Arithmetic Left / ShiftLogical Left

     SAR - Shift Arithmetic Right

     SBB - Subtract with Borrow/Carry

     SCAS - Scan String  (Byte, Word or Doubleword)

     SETAE/SETNB - Set if Above or Equal / Setif Not Below (386+)

     SETB/SETNAE - Set if Below / Set if NotAbove or Equal (386+)

     SETBE/SETNA - Set if Below or Equal / Setif Not Above (386+)

     SETE/SETZ - Set if Equal / Set if Zero(386+)

     SETNE/SETNZ - Set if Not Equal / Set ifNot Zero (386+)

     SETL/SETNGE - Set if Less / Set if NotGreater or Equal (386+)

     SETGE/SETNL - Set if Greater or Equal /Set if Not Less (386+)

     SETLE/SETNG - Set if Less or Equal / Setif Not greater or Equal (386+)

     SETG/SETNLE - Set if Greater / Set if NotLess or Equal (386+)

     SETS - Set if Signed (386+)

     SETNS - Set if Not Signed (386+)

     SETC - Set if Carry (386+)

     SETNC - Set if Not Carry (386+)

     SETO - Set if Overflow (386+)

     SETNO - Set if Not Overflow (386+)

     SETP/SETPE - Set if Parity / Set if ParityEven  (386+)

     SETNP/SETPO - Set if No Parity / Set ifParity Odd (386+)

     SGDT - Store Global Descriptor Table (286+privileged)

     SIDT - Store Interrupt Descriptor Table(286+ privileged)

     SHL - Shift Logical Left

     SHR - Shift Logical Right

     SHLD/SHRD - Double Precision Shift (386+)

     SLDT - Store Local Descriptor Table (286+privileged)

     SMSW - Store Machine Status Word (286+privileged)

     STC - Set Carry

     STD - Set Direction Flag

     STI - Set Interrupt Flag  (Enable Interrupts)

     STOS - Store String  (Byte, Word or Doubleword)

     STR - Store Task Register (286+privileged)

     SUB - Subtract

     TEST - Test For Bit Pattern

     VERR - Verify Read (286+ protected)

     VERW - Verify Write (286+ protected)

     WAIT/FWAIT - Event Wait

     WBINVD - Write-Back and Invalidate Cache(486+)

     XCHG - Exchange

     XLAT/XLATB - Translate

     XOR - Exclusive OR




TEXT

Intel8086 Family Architecture


        General Purpose Registers               Segment Registers


        AH/AL AX  (EAX)  Accumulator            CS     Code Segment

        BH/BL BX  (EBX)  Base                   DS     Data Segment

        CH/CL CX  (ECX)  Counter                SS     Stack Segment

        DH/DL DX  (EDX)  Data                   ES     Extra Segment

                                               (FS)    386 and newer

        (Exx) indicates 386+ 32 bitregister    (GS)    386 and newer



        Pointer Registers                       Stack Registers


        SI (ESI)  Source Index                  SP (ESP)  Stack Pointer

        DI (EDI)  Destination Index             BP (EBP)  Base Pointer

        IP        Instruction Pointer



        Status Registers


        FLAGS Status Flags   (see FLAGS)


        Special Registers (386+ only)


        CR0    Control Register 0        DR0    Debug Register 0

        CR2    Control Register 2        DR1    Debug Register 1

        CR3    Control Register 3        DR2    Debug Register 2

                                         DR3    Debug Register 3

        TR4    Test Register 4           DR6    Debug Register 6

        TR5    Test Register 5           DR7    Debug Register 7

        TR6    Test Register 6

        TR7    Test Register 7


        Register          Default Segment    Valid Overrides


        BP                      SS              DS, ES, CS

        SI or DI                DS              ES, SS, CS

        DI strings              ES              None

        SI strings              DS              ES, SS, CS


        - see CPU   DETECTING  Instruction Timing

阅读(1905) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~