ARM汇编语言伪指令-Alan0521-ChinaUnix博客

Alan0521

首页　| 　博文目录　| 　关于我

Alan0521

博客访问： 1375300
博文数量： 482
博客积分： 13297
博客等级：上将
技术积分： 2890
用户组：普通用户
注册时间： 2009-10-12 16:25

文章分类

全部博文（482）

Linux_drivers（9）

USB（1）

LCD（4）

SD_MMC（3）

uart（1）
History（0）
News（0）
Miscellaneous（1）
Exam（18）
ARM（39）

assembly（14）

hardware（2）

System（3）

arm_linux（2）

uboot（10）

MMU（1）

Error（1）

Qtopia（1）
C Sharp（36）
FPGA（11）
Windows（6）
Tools（104）

Git（18）

Regex（5）

Ohters（4）

Vim（77）
Hardware（25）

SPI（1）

USB（17）
Life（6）
C（54）

GCC（6）

ANSI C（33）

Keil C（15）
Linux（173）

Process（29）

File System（15）

Memory Managemen（31）

Drivers（26）

Kernel（24）

Ubuntu（21）

Makefile（7）

Linux_command（20）
未分配的博文（0）

文章存档

2012年（9）

2011年（407）

2010年（66）

我的朋友

相关博文

ARM汇编语言伪指令

分类： LINUX

2011-08-11 17:04:49

ARM中伪指令不是真正的ARM指令或者Thumb指令，这些伪指令在汇编编译时对源程序进行汇编处理时被替换成对应的ARM或Thumb指令（序列）。ARM伪指令包括ADR、ADRL、LDR和NOP等。
1、ADR（小范围的地址读取伪指令）
该指令将基于PC的地址值或基于寄存器的地址值读取到寄存器中。
语法格式
ADR{cond} register, expr
其中，cond为可选的指令执行的条件
      register为目标寄存器
      expr为基于PC或者基于寄存器的地址表达式，其取值范围如下：
当地址值不是字对齐时，其取值范围为-255~255.
当地址值是字对齐时，其取值范围为-1020~1020
当地址值是16字节对齐时，其取值范围将更大
在汇编编译器处理源程序时，ADR伪指令被编译器替换成一条合适的指令。通常，编译器用一条ADD指令或SUB指令来实现该ADR伪指令的功能。
因为ADR伪指令中的地址是基于PC或者基于寄存器的，所以ADR读取到的地址为位置无关的地址。当ADR伪指令中的地址是基于PC时，该地址与ADR伪指令必须在同一个代码段中。
示例
start MOV r0,#10 ；因为PC值为当前指令地址值加8字节
ADR r4, start ；本ADR伪指令将被编译器替换成SUB r4,pc,#0xc
2、 ADRL（中等范围的地址读取伪指令）
该指令将基于PC或基于寄存器的地址值读取到寄存器中。ADRL伪指令比ADR伪指令可以读取更大范围的地址。ADRL伪指令在汇编时被编译器替换成两条指令，即使一条指令可以完成该伪指令的功能。
语法格式
ADRL{cond} register,expr
示例
start MOV r0,#10 ；因为PC值为当前指令地址值加8字节
ADRL r4,start+60000 ；本ADRL伪指令将被编译器替换成下面两条指令
ADD r4,pc,#0xe800
ADD r4,r4,#0x254
3、LDR（大范围的地址读取伪指令）
LDR伪指令将一个32位的常数或者一个地址值读取到寄存器中
语法格式
LDR{cond} register, =[expr|label-expr]
其中，expr为32位的常量。编译器将根据expr的取值情况，如下处理LDR伪指令：
当expr表示的地址值没有超过MOV或MVN指令中地址的取值范围时，编译器用合适的MOV或MVN指令代替该LDR伪指令
当expr表示的地址值超过了MOV或者MVN指令中地址的取值范围时，编译器将该常数放在数据缓冲区中，同时用一条基于PC的LDR指令读取该常数。
label-expr为基于PC的地址表达式或者是外部表达式。当label-expr为基于PC的地址表达式时，编译器将label-expr表示的数值放在数据缓冲区（literal pool）中，然后将该LDR伪指令处理成一条基于PC到该数据缓冲区单元的LDR指令，从而将该地址值读取到寄存器中。这时，要求该数据缓冲区单元到PC的距离小于4KB。当label-expr为外部表达式，或者非当前段的表达式时，汇编编译器将在目标文件中插入一个地址重定位伪操作，这样连接器将在连接时生成该地址。
LDR伪指令主要有以下两种用途：
当需要读取到寄存器中的数据超过了MOV及MVN指令可以操作的范围时，可以使用LDR伪指令将该数据读取到寄存器中。
将一个基于PC的地址值或者外部的地址值读取到寄存器中。由于这种地址值是在连接时确定的，所以这种代码不是位置无关的。同时LDR伪指令的PC值到数据缓冲区中的目标数据所在的地址的偏移量要小于4KB。
示例
将0xff0读取到R1中
LDR R1，=0xFF0
汇编后将得到：
MOV R1，0xFF0
将0xfff读取到R1中
LDR R1，=0xFFF
汇编后将得到：
LDR R1，[PC,OFFSET_TO_LPOOL]
…
LPOOL DCD 0xFFF
将外部地址ADDR1读取到R1中
LDR R1，=ADDR1
汇编后将得到：
LDR R1，[PC,OFFSET_TO_LPOOL]
…
LPOOL   DCD ADDR1
4、NOP空操作伪指令
在汇编时将被替换成ARM中的空操作，如MOV R0，R0
NOP伪指令不影响CPSR中的条件标志位
ARM汇编程序中的符号
在ARM汇编语言中，符号（symbols）可以代表地址（addresse）、变量（variables）和数字常量（numeric constants）。当符号代表地址时，又称为标号（lable）。当标号以数字开头时，其作用范围为当前段（当前段没有使用ROUT伪操作时），这种标号又称为局部标号（lacal lable）。符号变量包括变量、数字常量、标号和局部标号。
1、变量
在程序中，变量的值在汇编处理过程中可能会发生改变。在ARM汇编中变量有数字变量、逻辑变量和串变量3种类型。变量的类型在程序中是不可以改变的。
数字变量的取值范围为数字常量和数字表达式所能表示的数值；逻辑变量的取值范围为{true}和{flash}；串变量的取值范围为串表达式可以表达的范围。
在ARM汇编语言中，使用GBLA、GBLL及GBLS声明全局变量；使用LCLA、LCLL及LCLS声明局部变量；使用SETA、SETL及SETS为这些变量赋值。
2、数字常量
数字常量是32位的整数。在ARM汇编语言中，使用EQU来定义数字常量。数字常量一经定义就不可修改。进行大小比较时，认为数字常量都是无符号数。
3、汇编时变量的替换
如果在串变量前有一个$字符，在汇编时编译器将用改串的数值来取代该串变量。
对于数字变量来说，如果该变量前面有一个$字符，在汇编时编译器将该数字变量的数值转换成十六进制的串，然后用该十六进制的串取代$字符后的数字变量。
对于逻辑变量来说，如果该逻辑变量前面有一个$字符，在汇编时编译器将该逻辑变量替换成它的取值（T或者F）
如果程序中需要字符$，则用$$来表示，编译器将不进行变量替换，而是将$$当作$.
通常情况下，包含在两个竖线（|）之间的$并不表示进行变量替换。但是如果竖线（|）是在双引号内，则将进行变量替换。
使用“.”来表示变量名称的结束。
4、标号
标号是表示程序中的指令或者数据地址的符号。根据标号的生成方式可分为3种：
基于PC的标号。基于PC的标号是位于目标指令前或者程序中数据定义伪操作前的标号。这种标号在汇编时将被处理成PC值加上（或减去）一个数字常量。常用于表示跳转指令的目标地址，或者代码段中所嵌入的少量数据。
基于寄存器的标号。基于寄存器的标号常用MAP和FIELD未定义操作，也可以该用EQU伪定义。这种标号在汇编时将被处理成寄存器的值加上（或减去）一个数据常量。常用于访问数据段中的数据。
绝对地址。绝对地址是一个32位数据。它可以寻址232 -1，即直接可以寻址整个内存空间。
5、局部标号
局部标号主要在局部范围内使用。它由两部组成：开头是一个0-99直接的数字，后面紧接一个通常表示该局部变量作用范围的符号。
局部变量的作用范围通常为当前段，也可以用伪操作ROUT来定义局部变量的作用范围。
局部变量定义的语法格式如下：
N{routname}，其中，N为0~99之间的数字。routname为符号，通常为该变量作用范围的名称（用ROUT伪操作定义的）。
局部变量引用的语法格式如下：
%{F|B}{A|T}N{routname}
其中，N为局部变量的数字号。
routname 为当前作用范围的名称（用ROUT伪操作定义的）
%表示引用操作
F指示编译器只向前搜索
B指示编译器只向后搜索
A指示编译器搜索宏的所有嵌套层次
T指示编译器搜索宏的当前层次
如果F和B都没有指定，编译器先向前搜索，再向后搜索
如果A和T都没有指定，编译器搜索所有从当前层次到宏的最高层次，比当前层次低的层次不再搜索。
如果指定了routname，编译器向前搜索最近的ROUT伪操作，若routname与该ROUT伪操作定义的名称不匹配，编译器报告错误，汇编失败。
ARM汇编语言中的表达式
表达式是由符号、数值、单目或多目操作符以及括号组成的。
1、字符串表达式
字符串表达式由字符串、字符串变量、操作符以及括号组成。字符串的最大长度为512字节，最小长度为0.下面介绍字符串表达式的组成元素。
字符串：由包含在双引号内的一系列的字符组成。字符串的长度受到ARM汇编语言语句长度的限制。当在字符串中包含美元符号$或者引号＂时，用$$表示一个$，用＂＂表示一个＂。
字符串变量：用伪操作GBLS或者LCLS声明，用SETS赋值。
操作符：
（1）LEN：返回字符串的长度
：LEN：A
其中，A为字符串变量
（2）CHR：可以将0~255之间的整数作为含一个ASCII字符的字符串。当有些ASCII字符不方便放在字符串中时，可以使用CHR将其放在字符串表达式中。
：CHR：A
其中，A为某一字符的ASCII值
（3）STR：将一个数字量或者逻辑表达式转换成串。对于32位的数字量而言，STR将其转换成8个十六进制数组成的串；对于逻辑表达式而言，STR将其转换成字符串T或者F
：STR：A
其中，A为数字量或者逻辑表达式
（4）LEFT：返回一个字符串最左端一定长度的子串
A：LEFT：B
其中，A为源字符串，B为数字量，表示LEFT将返回的字符个数
（5）RIGHT：返回一个字符串最右端一定长度的子串
A：RIGHT：B
其中，A为源字符串，B为数字量，表示RIGHT将返回的字符个数
（6）CC：用于连接两个字符串。
A：CC：B
其中，A为第1个源字符串。B为第2个源字符串。CC操作符将字符串B连接在字符串A的后面。
2、数字表达式
数字表达式由数字常量、数字变量、操作符和括号组成
数字变量用伪操作GBLA或者LCLA声明，用SETA赋值，它代表一个32位的数字量。
操作符：
（1）NOT：按位取反
：NOT：A
其中，A为一个32位数字量
（2）+、—、×、/及MOD算术操作符
A+B，A-B，A×B，A/B
A：MOD：B表示A除以B的余数
（3）ROL，ROR，SHL，SHR移位
A：ROL：B将整数A循环左移B位
A：SHL：B将整数A左移B位
（4）AND、OR及EOR按位逻辑操作符
A：AND：B将数字表达式A和B按位作逻辑与操作
3、基于寄存器和基于PC的表达式
基于寄存器的表达式表示了某个寄存器的值加上（或者减去）一个数字表达式
基于PC的表达式表示了PC寄存器的值加上（或减去）一个数字表达式。基于PC的表达式通常由程序中的标号与一个数字表达式组成。相关的操作符：
（1）BASE：返回基于寄存器的表达式中的寄存器编号。
：BASE：A    A为基于寄存器的表达式
（2）INDEX：返回基于寄存器的表达式相对于其基址寄存器的偏移量。
：INDEX：A   A为基于寄存器的表达式
（3）＋、﹣：正负号，可以放在数字表达式或者基于PC的表达式前面。
+A（﹣A）   A为基于PC的表达式或者数字表达式
4、逻辑表达式
由逻辑量、逻辑操作符、关系操作符以及括号组成，取值范围为{FLASE}和{TRUE}
关系操作符：用于表示两个同类表达式之间的关系。关系操作符和它的两个操作数组成一个逻辑表达式，其取值为{FALSE}或{TRUE}
如A=B 表示A等于B
A/=B，A<>B表示A不等于B
逻辑操作符：进行两个逻辑表达式之间的基本逻辑操作。操作的结果为{FLASE}或{TRUE}
：LNOT：A 逻辑表达式A的值取反
A：LAND：B逻辑表达式A和B逻辑与
5、其他的一些操作符
（1）？：返回定义符号A的代码行所生成的可执行代码的字节数
？A
其中，A为一个符号
（2）DEF：判断某个符号是否已定义
：DEF：A
如果符号A已经定义，上述结果为{TRUE}，否则为{FLASE}
（3）SB_OFFSET_19_12
：SB_OFFSET_19_12：label 其中，label为一个标号
返回（label-SB）的bits[19:12]
（4）SB_OFFSET_11_0
：SB_OFFSET_11_0：label
返回（label-SB）的bits[11:0]
====

%CF%EB%B7%C9%B5%C4%B4%FC%CA%F3/blog/item/ba6e93cb867a9e17be09e68e.html

阅读(1320) | 评论(0) | 转发(0) |

上一篇：基本的ATPCS规则

下一篇：代码位置相关与无关

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6