汇编认识-shiyigudong-ChinaUnix博客

石头的奔跑

首页　| 　博文目录　| 　关于我

shiyigudong

博客访问： 1741666
博文数量： 98
博客积分： 667
博客等级：上士
技术积分： 1631
用户组：普通用户
注册时间： 2009-04-27 15:59

个人简介

一沙一世界一树一菩提

文章分类

全部博文（98）

汇编&硬件&代码优（14）
嵌入式（14）

视频（3）
杂谈（4）
C++/C（4）
python（1）
nuttx（0）
飞控（9）
机器学习（1）
bacnet（2）
认识经济（4）
irrlicht（2）
linux（39）
dsp（1）
关于nandflash（0）
arm boot的肤浅认（0）
未分配的博文（3）

文章存档

2021年（8）

2020年（16）

2019年（8）

2017年（1）

2016年（11）

2015年（17）

2014年（9）

2013年（4）

2012年（19）

2011年（1）

2009年（4）

我的朋友

相关博文

汇编认识

分类： C/C++

2019-12-22 12:16:43

首先说说x86,x64,x86-64的区别：
个人认为什么x86,x64.....一类的术语都是cpu硬件系统架构，由于架构不同，也就对应不同的指令集，所以我们一般也就说指令集是x86,x64.....可能理解或者描述有误，反正就是那么一个硬件和指令集一一对应的一堆吧。

以下内容都来源于伟大的internet，也有自己的一些见解和一些例子。
x86是指intel的开发的一种32位指令集，从386开始时代开始的，一直沿用至今，是一种cisc指令集，所有intel早期的cpu，amd早期的cpu都支持这种指令集，intel官方文档里面称为“IA-32”
　　x84_64是x86 CPU开始迈向64位的时候，有2选择：1、向下兼容x86。2、完全重新设计指令集，不兼容x86。AMD抢跑了，比Intel率先制造出了商用的兼容 x86的CPU，AMD称之为AMD64，抢了64位PC的第一桶金，得到了用户的认同。而Intel选择了设计一种不兼容x86的全新64为指令集，称之为IA-64（这玩意就是安腾），但是比amd晚了一步，而且IA-64也挺惨淡的，因为是全新设计的CPU，没有编译器，也不支持 windows（微软把intel给忽悠了，承诺了会出安腾版windows server版，但是迟迟拿不出东西）。。。后来不得不在时机落后的情况下也开始支持AMD64的指令集，但是换了个名字，叫x86_64，表示是x86 指令集的64扩展，大概是不愿意承认这玩意是AMD设计出来的。
也就是说实际上，x86_64,x64,AMD64基本上是同一个东西，我们现在用的intel/amd的桌面级CPU基本上都是x86_64，与之相对的arm,ppc等都不是x86_64。
　　x86、x86_64主要的区别就是32位和64位的问题，x86中只有8个32位通用寄存器，eax,ebx,ecx，edx, ebp, esp, esi, edi。x86_64把这8个通用寄存器扩展成了64位的，并且比x86增加了若干个寄存器（增加了8个，变成了总共16个通用寄存器）。同样的 MMX的寄存器的位数和数量也进行了扩展。此外cpu扩展到64位后也能支持更多的内存了，等等许多好处。
　　对于普通程序来说，CPU位数的扩展、寄存器数量的增加不会带来明显的性能提升，比如IE浏览器、Office办公这类的软件。特定的程序很能够充分利用64位CPU、更多的寄存器带来的优势，比如MMX除了能提升多媒体程序的性能，对矩阵、多项式、向量计算都能带来提升，更多的MMX寄存器、更大的寄存器字长都有利于SIMD指令的执行，能够提升CPU对数据的吞吐量（RISC指令集的CPU动不动就有数百个寄存器，可以有效的缓存中间计算结果，不需要把中间结果写入内存，从而减少内存访问次数，显著提升性能）

另外这里也顺便说下ia64：以下内容来自baidu。
IA64，又称英特尔安腾架构（Intel Itanium architecture），使用在处理器家族上的，由英特尔公司与共同开发，2001年首次推出。
其实ia64的历史早于x86-64，最初由Intel和惠普于1990年联合推出。由于ia64不与32位兼容，所以没有受到重视。而后为了日益扩张的计算需求，重新将ia64拿出来，发布了系列。ia64是一种崭新的系统，和完全没有相似性，不应该把它与x86-64或x64弄混。基于ia64处理器架构的服务器具有64位运算能力、64位和64位，突破了传统的许多限制，在数据的处理能力，系统的稳定性、安全性、可用性、可管理性等方面获得了突破性的提高。它是Intel自推出32位微处理器以来，在高性能计算机领域的又一座里程碑。
x64和ia64处理器都能够运行和应用程序，但是区别在于：x64架构基于x86，是为了让CPU兼容而产生的技术。x64架构的设计是采用直接简单的方法将目前的x86指令集扩展。这个方法与当初的由16位扩展至32位的情形很相似。优点在于用户可以自行选择x86平台或x64平台，兼容性高。ia64则是原生的纯64位计算处理器，并且与指令不兼容。如果想要执行x86指令需要支持，而且效率不高。优点在于ia64架构体系将拥有64位能力，能够支持更大的内存寻址空间。并且由于架构的改变，性能比起x64的64位兼容模式更高更强。所以，ia64操作系统也是比较少见的，由于只能在系列处理器及AMD部分服务器处理器运行，所以主流市场并不常见。而且，这些ia64架构处理器也不能够使用x64操作系统。而x64处理器则可以自由选择x86或是x64操作系统。

下面进入正题，下面所说的所有内容都是使用GNU GCC编译器。GUN GCC使用传统的AT＆T语法，它在Unix-like操作系统上使用，而不是dos和windows系统上通常使用的Intel语法。如：
movq %rsp， %rbp

movq是一个最常见的汇编指令的名称，百分号表示rsp和rbp是寄存器，在AT＆T语法中，有两个参数的时候，始终先给出源(source)，然后再给出目标(destination)。
在其他地方（例如英特尔手册），您将看到英特尔语法，区别之处是Intel语法省去了百分号并颠倒了参数的顺序。
在阅读手册和网页时，通过看有没有”%”就知道是用的哪种汇编格式了。
X86-64中，所有寄存器都是64位，相对32位的x86来说，标识符发生了变化，比如：从原来的%ebp变成了%rbp。为了向后兼容性，%ebp依然可以使用，不过指向了%rbp的低32位。下面的代码分析中，会有用到带“r”的寄存器，说明是64位操作，带“e”的寄存器，说明是32位操作。

让寄存器为己所用，就得了解它们的用途，这些用途都涉及函数调用，X86-64有16个64位寄存器，分别是：%rax，%rbx，%rcx，%rdx，%esi，%edi，%rbp，%rsp，%r8，%r9，%r10，%r11，%r12，%r13，%r14，%r15。其中：

%rax 作为函数返回值使用。
%rsp 栈指针寄存器，指向栈顶
%rbp 栈桢指针，指向栈基
%rdi，%rsi，%rdx，%rcx，%r8，%r9 用作函数参数，依次对应第1参数，第2参数。。。
%rbx，%r12，%r13，%14，%15 用作数据存储，遵循被调用者使用规则，简单说就是随便用，调用子函数之前要备份它，以防他被修改
%r10，%r11 用作数据存储，遵循调用者使用规则，简单说就是使用之前要先保存原值
%rip: 相当于PC指针指向当前的指令地址

下面说说%esp(rsp)和%ebp(rbp),这是两个和堆栈有关的寄存器。

esp是栈指针，是cpu机制决定的，push、pop指令会自动调整esp的值，ebp只是存取某时刻的esp，这个时刻就是进入一个函数内后，cpu会将esp的值赋给ebp，此时就可以通过ebp对栈进行操作，比如获取函数参数，局部变量等。下面内容是出自某博主的文笔，感觉描述比较实在：

EBP是当前函数的存取指针，即存储或者读取数时的指针基地址；ESP就是当前函数的栈顶指针。每一次发生函数的调用（主函数调用子函数）时，在被调用函数初始时，都会把当前函数（主函数）的EBP压栈，以便从子函数返回到主函数时可以获取EBP。
下面是按调用约定__stdcall 调用函数test(int p1,int p2)的汇编代码
假设执行函数前堆栈指针ESP为0xAAAAAAA ；EBP为0xAAAAAB0
push p2 //参数2入栈, ESP -= 4h , ESP = 0xAAAAAAA - 4h = 0xAAAAAA6
push p1 //参数1入栈, ESP -= 4h , ESP = 0xAAAAAAA - 8h = 0xAAAAAA2
call test //压入返回地址 ESP -= 4h, ESP = 0xAAAAAAA- 0Ch = 0xAAAAA9E,注意：这里是test函数的返回地址，即在代码段中的地址（偏移）。
//进入函数内
{
pushl %ebp //保护先前EBP指针， EBP入栈(即0xAAAAAB0入栈，注意与返回地址区别)， ESP-=4h, ESP = 0xAAAAA9A
movl %esp, %ebp //设置EBP指针指向栈顶 0xAAAAA9A
movl 12(%ebp), %eax //ebp+12为0xAAAAAA6即参数2的位置
movl 8(%ebp), %ebx //ebp+8为0xAAAAAA2,即参数1的位置
sub $8, %esp //局部变量所占空间ESP-=8, ESP = 0xAAAAA92
...
add %8, %esp //释放局部变量, ESP+=8, ESP = 0xAAAAA9A
popl %ebp //出栈,恢复EBP, ESP+=4, ESP = 0xAAAAA9E,即把栈中地址0xAAAAA9A的内容pop到ebp中
ret 8 //ret返回,弹出返回地址,ESP+=4, ESP=0xAAAAAA2, 后面加操作数8为平衡堆栈,ESP+=8,ESP=0xAAAAAAA, 恢复进入函数前的堆栈.
}
看完汇编后,再看EBP和ESP的定义,哦,豁然开朗,
原来ESP就是一直指向栈顶的指针,而EBP只是存取某时刻的栈顶指针,以方便对栈的操作,如获取函数参数、局部变量等。
另外，如果在汇编代码里看到call foo这样的语句，其实相当于下面2句的意思：

Pushl %rip //保存下一条指令（第41行的代码地址）的地址，用于函数返回继续执行
Jmp foo //跳转到函数foo

而看到ret，则相当于：
popl %rip //恢复指令指针寄存器
汇编代码里的call和ret对应子函数的入口和出口。

有时候也会在ret前面有一句leave语句，这也是恢复现场语句，相当于下面两句的意思：
Movl %ebp %esp //撤销栈空间，回滚%esp --- 回到当前帧的栈基位置
Popl %ebp //恢复上一个栈帧的%ebp

再来说说参数传递

X86时代，参数传递是通过入栈实现的，相对CPU来说，存储器访问太慢；这样函数调用的效率就不高，在x86-64时代，寄存器数量多了，GCC就可以利用多达6个寄存器来存储参数，多于6个的参数，依然还是通过入栈实现。了解这些对我们写代码很有帮助，起码有两点启示：

寄存器操作速度速度远大于栈操作速度，所以尽量使用6个以下的参数列表
传递大对象，尽量使用指针或者引用

阅读(1960) | 评论(0) | 转发(0) |

上一篇：常用技术方案开发周期预估方法

下一篇：px4 mavlink阅读记录

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6