是CPU二进制指令的可读写版本。我们在后面将有单独的一章来讲述。从来没有接触过的读者在阅读本书时可能会有一些迷惑 。
大多数都是非常古板的,都是一些寄存器号码。但是工具链(toolchains)可以使得使用微处理机语言变得简单。工具链至少允许程序员引用一些助记符,而严格的要求严格的数字编码。大多我们都是用比较熟悉的C预处理器。C预处理器会把C风格的注解去掉,而得到一个可用的汇编代码。
有C预处理器的帮助,汇编程序都是用助记符来表示寄存器。助记符同时也代表了每个寄存器的用法(我们将在2.2节介绍这一点)。
对於熟悉但不熟悉的读者,下面是一些例子。
/* this is a comment */
#so is this
entrypoint: #this's a label
addu $1, $2, $3 # (registers) $1 = $2 + $3
与大多数一样, 也是以行为单位的。每一行的结束是一个指令的结束,并且忽略任何“#”之后的内容,认为是注释。在一行里可以有多条指令。指令之间要用分号“;”隔开。
一个符号(label)是一个后面跟着冒号“:”的字。符号可以是任何字符串的组合。符号被用来定义一段代码的入口和定义数据段的一个存储位置。
如上所示,许多指令都是3个操作数/符(operand)。目标寄存器在左侧(注意,这一点与Intetel x86 正相反)。一般而言,寄存器结果和操作符的顺序与C语言或其他符号语言的方式是一致的。 例如:
subc $1, $2, $3
意味着:
$1 = $2 - $3;
这方面我们就先讲这么多。
2.2 寄存器
对於一个程序,可以有32个通用寄存器,分别为:$0-$31。其中,两个,也只有两个的使用不同于其他。
$0:不管你存放什么值,其返回值永远是零。
$31:永远存放着正常函数调用指令(jal)的返回地址。请注意call-by-registe的jalr指令可以使用任何寄存器来存放其返回地址。当然,如不用$31,看起来程序会有点古怪。
其他方面,所有的寄存器都是一样的。可以被用在任何一个指令中(你也可以用$0作为一个指令的目标寄存器。当然不管你存入什么数据,数据都消失了。)
体系结构下,程序计数器不是一个寄存器,其实你最好不要去那样想。在一个具有流水线的CPU中,程序计数器的值在一个给定的时刻有多个可选值。这一点有点迷惑人。jal指令的返回地址跟随其后的第二条指令。
...
jal printf
move $4, $6
xxx # return here after call
上述的解释是有道理的,因为紧跟踪jal指令后面的指令,由於在delay slot(延迟位置)上--请记住,关于延迟位置的规则是该指令将在转移目标(如上述的printf)之前执行。延迟位置指令经常被用来传递函数调用的参数。
里没有状态码。CPU状态寄存器或内部都不包含任何用户程序计算的结果状态信息。
hi和lo是与乘法运算器相关的两个寄存器大小的用来存放结果的地方。它们并不是通用寄存器,除了用在乘除法之外,也不能有做其他用途。但是,里定义了一些指令可以往hi和lo里存入任何值。想一想我们会发现,这是非常有必要的当你想要恢复一个被打断的程序时。
浮点运算协处理器(浮点加速器,FPA),如果存在的话,有32个浮点寄存器。按的简单约定讲,是从$f0到$31。
实际上,对於 I和 II的机器,只有16个偶数号的寄存器可以用来做数学计算。当然,它们可以既用来做单精度(32位)和双精度(64位)。当你做一个双精度的运算时,寄存器$f1存放$f0的余数。奇数号的寄存器只用来作为寄存器与FPA之间的数据传送。
III CPU有32个FP寄存器。但是为了保持软件与过去的兼容性,最好不要用奇数号的寄存器。
2.2.1 助记符与通用寄存器的用法
我们已经描述了一些体系结构方面的内容,下面来介绍一些软件方面的内容。
寄存器编号 助记符 用法
0 zero 永远返回值为0
1 at 用做汇编器的暂时变量
2-3 v0, v1 子函数调用返回结果
4-7 a0-a3 子函数调用的参数
8-15 t0-t7 暂时变量,子函数使用时不需要保存与恢复
24-25 t8-t9
16-25 s0-s7 子函数寄存器变量。子函数必须保存和恢复使用过的变量在函数返回之前,从而调用函数知道这些寄存器的值没有变化。
26,27 k0,k1 通常被中断或异常处理程序使用作为保存一些系统参数
28 gp 全局指针。一些运行系统维护这个指针来更方便的存取“static“和”extern"变量。
29 sp 堆栈指针
30 s8/fp 第9个寄存器变量。子函数可以用来做桢指针
31 ra 子函数的返回地□
'7d
虽然硬件没有强制性的指定寄存器使用规则,在实际使用中,这些寄存器的用法都遵循一系列约定。这些约定与硬件确实无关,但如果你想使用别人的代码,编译器和操作系统,你最好是遵循这些约定。
寄存器约定用法引人了一系列的寄存器约定名。在使用寄存器的时候,要尽量用这些约定名或助记符,而不直接引用寄存器编号。
1996年左右,SGI开始在其提供的编译器中使用新的寄存器约定。这种新约定可以用来建立使用32位地址或64位地址的程序,分别叫 "n32"和"n64"。我们暂时不讨论这些,将会在第10章详细讨论。
寄存器名约定与使用
*at: 这个寄存器被汇编的一些合成指令使用。如果你要显示的使用这个寄存器(比如在异常处理程序中保存和恢复寄存器),有一个汇编directive可被用来禁止汇编器在directive之后再使用at寄存器(但是汇编的一些宏指令将因此不能再可用)。
*v0, v1: 用来存放一个子程序(函数)的非浮点运算的结果或返回值。如果这两个寄存器不够存放需要返回的值,编译器将会通过内存来完成。详细细节可见10.1节。
*a0-a3: 用来传递子函数调用时前4个非浮点参数。在有些情况下,这是不对的。请参考10.1细节。
* t0-t9: 依照约定,一个子函数可以不用保存并随便的使用这些寄存器。在作表达式计算时,这些寄存器是非常好的暂时变量。编译器/程序员必须注意的是,当调用一个子函数时,这些寄存器中的值有可能被子函数破坏掉。
*s0-s8: 依照约定,子函数必须保证当函数返回时这些寄存器的内容必须恢复到函数调用以前的值,或者在子函数里不用这些寄存器或把它们保存在堆栈上并在函数退出时恢复。这种约定使得这些寄存器非常适合作为寄存器变量或存放一些在函数调用期间必须保存原来值。
* k0, k1: 被OS的异常或中断处理程序使用。被使用后将不会恢复原来的值。因此它们很少在别的地方被使用。
* gp: 如
果存在一个全局指针,它将指向运行时决定的,你的静态数据(static data)区域的一个位置。这意味着,利用gp作基指针,在gp指针32K左右
的数据存取,系统只需要一条指令就可完成。如果没有全局指针,存取一个静态数据区域的值需要两条指令:一条是获取有编译器和loader决定好的32位的
地址常量。另外一条是对数据的真正存取。为了使用gp, 编译器在编译时刻必须知道一个数据是否在gp的64K范围之内。通常这是不可能的,只能靠猜测。
一般的做法是把small global data (小的全局数据)放在gp覆盖的范围内(比如一个变量是8字节或更小),并且让linker报警如果
小的全局数据仍然太大从而超过gp作为一个基指针所能存取的范围。
并不是所有的编译和运行系统支持gp的使用。
*sp: 堆栈指针的上下需要显示的通过指令来实现。因此通常只在子函数进入和退出的时刻才调整堆栈的指针。这通过被调用的子函数来实现。sp通常被调整到这个被调用的子函数需要的堆栈的最低的地方,从而编译器可以通过相对於sp的偏移量来存取堆栈上的堆栈变量。详细可参阅10.1节堆栈使用。
* fp: fp的另外的约定名是s8。如果子函数想要在运行时动态扩展堆栈大小,fp作为桢指针可以被子函数用来记录堆栈的情况。一些编程语言显示的支持这一点。汇编编程员经常会利用fp的这个用法。C语言的库函数alloca()就是利用了fp来动态调整堆栈的。
如果堆栈的底部在编译时刻不能被决定,你就不能通过sp来存取堆栈变量,因此fp被初始化为一个相对与该函数堆栈的一个常量的位置。这种用法对其他函数是不可见的。
* ra: 当调用任何一个子函数时,返回地址存放在ra寄存器中,因此通常一个子程序的最后一个指令是jr ra.
子函数如果还要调用其他的子函数,必须保存ra的值,通常通过堆栈。
阅读(1427) | 评论(0) | 转发(0) |