Chinaunix首页 | 论坛 | 博客
  • 博客访问: 367089
  • 博文数量: 36
  • 博客积分: 2071
  • 博客等级: 大尉
  • 技术积分: 797
  • 用 户 组: 普通用户
  • 注册时间: 2010-11-20 12:08
文章分类
文章存档

2011年(2)

2010年(34)

我的朋友

分类: 嵌入式

2010-12-02 08:44:10

ARM汇编伪指令介绍

 ARM 汇编语言程序里,有一些特殊的助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,这些特殊指令助记符被称为伪指令,他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。 

ARM的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。 

1) 其他常用的伪指令

还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条: 

— AREA 

— ALIGN 

— CODE16  CODE32 

— ENTRY 

— END 

— EQU 

— EXPORT (或 GLOBAL  

— IMPORT 

— EXTERN 

— GET (或 INCLUDE  

— INCBIN 

— RN 

— ROUT 

1. AREA 

语法格式: 

AREA 段名 属性 1 ,属性 2 …… 

AREA 伪指令用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用 “ | ” 括起来,如 |1_test|  

属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下: 

— CODE 属性:用于定义代码段,默认为 READONLY  

— DATA 属性:用于定义数据段,默认为 READWRITE  

— READONLY 属性:指定本段为只读,代码段默认为 READONLY  

— READWRITE 属性:指定本段为可读可写,数据段的默认属性READWRITE  

— ALIGN 属性:使用方式为 ALIGN 表达式。在默认时, ELF (可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为 0  31 ,相应的对齐方式为 2 表达式次方。 

— COMMON 属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的 COMMON 段共享同一段存储单元。 

一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。 

使用示例:

AREA Init  CODE  READONLY 

该伪指令定义了一个代码段,段名为 Init ,属性为只读 

2. ALIGN

语法格式:

ALIGN { 表达式 { ,偏移量 }} 

ALIGN 伪指令可通过添加填充字节的方式,使当前位置满足一定的对其方式 | 。其中,表达式的值用于指定对齐方式,可能的取值为 2 的幂,如 1  2  4  8  16 等。若未指定表达式,则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为: 2 的表达式次幂+偏移量。 

使用示例: 

AREA Init CODE READONLYALIEN 3;指定后面的指令为8字节对齐。 

指令序列 

END 

3. CODE16CODE32 

语法格式: 

CODE16 (或 CODE32  

CODE16 伪指令通知编译器,其后的指令序列为 16 位的 Thumb 指令。 

CODE32 伪指令通知编译器,其后的指令序列为 32 位的 ARM 指令。 

若在汇编源程序中同时包含 ARM 指令和 Thumb 指令时,可用 CODE16 伪指令通知编译器其后的指令序列为 16 位的 Thumb 指令, CODE32 伪指令通知编译器其后的指令序列为 32 位的 ARM 指令。因此,在使用 ARM 指令和 Thumb 指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知编译器其后指令的类型,并不能对处理器进行状态的切换。 

使用示例: 

AREA Init  CODE  READONLY 

…… 

CODE32 ;通知编译器其后的指令为 32 位的 ARM 指令 

LDR R0 ,= NEXT  1 ;将跳转地址放入寄存器 R0 

BX R0 ;程序跳转到新的位置执行,并将处理器切换到 Thumb 工作状态 

…… 

CODE16 ;通知编译器其后的指令为 16 位的 Thumb 指令 

NEXT LDR R3,=0x3FF 

…… 

END ;程序结束 

4. ENTRY 

语法格式: 

ENTRY 

ENTRY 伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个 ENTRY (也可以有多个,当有多个 ENTRY 时,程序的真正入口点由链接器指定),但在一个源文件里最多只能有一个 ENTRY (可以没有)。 

使用示例: 

AREA Init  CODE  READONLY 

ENTRY ;指定应用程序的入口点 

…… 

5. END 

语法格式: 

END 

END 伪指令用于通知编译器已经到了源程序的结尾。 

使用示例: 

AREA Init  CODE  READONLY 

…… 

END ;指定应用程序的结尾 

6. EQU 

语法格式: 

名称 EQU 表达式 { ,类型 } 

EQU 伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于 C 语言中的# define  

其中 EQU 可用 “ * ” 代替。 

名称为 EQU 伪指令定义的字符名称,当表达式为 32 位的常量时,可以指定表达式的数据类型,可以有以下三种类型: 

CODE16  CODE32  DATA 

使用示例: 

Test EQU 50 ;定义标号 Test 的值为 50 

Addr EQU 0x55 CODE32 ;定义Addr 的值为0x55,且该处为32位的ARM令。 

7. EXPORT(或GLOBAL 

语法格式: 

EXPORT 标号 {[WEAK]} 

EXPORT 伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。 EXPORT可用 GLOBAL 代替。标号在程序中区分大小写, [WEAK] 选项声明其他的同名标号优先于该标号被引用。 

使用示例: 

AREA Init  CODE  READONLY 

EXPORT Stest ;声明一个可全局引用的标号Stest…… 

END 

8. IMPORT 

语法格式:

IMPORT 标号 {[WEAK]} 

IMPORT 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。 

标号在程序中区分大小写, [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B  BL 指令引用,则将 B  BL指令置为 NOP 操作。 

使用示例: 

AREA Init  CODE  READONLY 

IMPORT Main ;通知编译器当前文件要引用标号Main,但Main 在其他源文件中定义…… 

END 

9. EXTERN 

语法格式: 

EXTERN 标号 {[WEAK]} 

EXTERN 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。标号在程序中区分大小写, [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B  BL 指令引用,则将 B  BL指令置为 NOP 操作。 

使用示例: 

AREA Init  CODE  READONLY 

EXTERN Main ;通知编译器当前文件要引用标号Main,但Main 在其他源文件中定义…… 

END 

10. GET(或INCLUDE

语法格式: 

GET 文件名 

GET 伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用 INCLUDE 代替 GET  

汇编程序中常用的方法是在某源文件中定义一些宏指令,用 EQU 定义常量的符号名称,用 MAP FIELD 定义结构化的数据类型,然后用 GET 伪指令将这个源文件包含到其他的源文件中。使用方法与 C 语言中的 “ include ” 相似。 

GET 伪指令只能用于包含源文件,包含目标文件需要使用 INCBIN 伪指令 

使用示例: 

AREA Init  CODE  READONLY 

GET a1.s ;通知编译器当前源文件包含源文件a1.s 

GE T C\a2.s ;通知编译器当前源文件包含源文件C\ a2.s …… 

END 

11. INCBIN 

语法格式: 

INCBIN 文件名 

INCBIN 伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。 

使用示例: 

AREA Init  CODE  READONLY 

INCBIN a1.dat ;通知编译器当前源文件包含文件a1.dat 

INCBIN C\a2.txt ;通知编译器当前源文件包含文件C\a2.txt…… 

END 

12. RN 

语法格式: 

 名称 RN 表达式 

 RN 伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中,名称为给寄存器定义的别名,表达式为寄存器的编码。 

使用示例: 

 Temp RN R0 ;将R0 定义一个别名Temp 

13. ROUT 

语法格式: 

名称 } ROUT 

ROUT 伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的 AREA ,而使用 ROUT 后,局部变量的作为范围为当前 ROUT 和下一个 ROUT 之间。

2) ARM杂项伪指令

1. ADR伪指令:小范围的地址读取伪指令。

ADR指令将基于PC相对偏移的地址值读取到寄存器中。在汇编编译源程序时,ADR伪指令被编译器替换成一条合适的指令。通常编译器用一条ADD指令或SUB指令来实现该ADR伪指令的功能。

  指令格式ADR{cond} register ,expr

     Register  加载的寄存器

     Expr 程序相对偏移或寄存器相对偏移的表达式

      非字对齐地址在-255255字节范围内

       字对齐地址在-10201020字节范围内。

    举例

       Start   MOV  R1#10

             ADR   R4start   ;相当于PC-10后赋值给R4

2. ADRL指令:中等范围的地址读取伪指令

ADRL指令将基于PC相对偏移的地址值或基于相对偏移的地址值读取到寄存器中,比ADR伪指令可读取更大范围的地址。在汇编编译源程序时,ADRL伪指令被编译器替换成两条合适的指令。若不能用两条指令实现ADRL伪指令功能,则产生错误,编译失败。

    指令格式与ADR相同

    非字对齐地址在64K字节范围内;

    字对齐地址在256K字节范围内。

    举例:

     Start   MOV  R1#10

            ADR   R4start+6000   ;=>ADD R4,PC,#0xe800    ADD R4,R4,#0x254

3. LDR指令  大范围的地址读取伪指令

LDR伪指令用于加载32位的立即数或一个地址值到指定寄存器。

在汇编编译源程序时,LDR指令被编译器替换成一条合适的指令,若加载的常数未超出MOVMVN的范围,则使用MOVMVN指令代替该LDR伪指令,否则汇编器将常量放入字池(内存),并使用一条程序相对偏移的LDR指令从文字池读出常量。

 指令格式LDR {cond} register , = expr/label_expr

           Expr 32位立即数  

           Label_expr 基于PC的地址表达式或外部表达式

 举例

          LDR   R0=0x123987   加载32位立即数

          LDR   R0=DATA_BUF+60 加载DATA_BUF地址+60

4. NOP指令

NOP指令产生所需的ARM无操作代码。可以使用指令MOV R0R0NOP不能有条件使用。执行和不执行无操作指令是一样的,因而不需要有条件执行。ALU状态不受NOP影响。

3) 符号定义( Symbol Definition )伪指令 

符号定义伪指令用于定义 ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。 

常见的符号定义伪指令有如下几种: 

Ø 用于定义全局变量的 GBLA  GBLL  GBLS  

Ø 用于定义局部变量的 LCLA  LCLL  LCLS  

Ø 用于对变量赋值的 SETA  SETL  SETS  

Ø 为通用寄存器列表定义名称的 RLIST

1. GBLAGBLL GBLS 

语法格式: 

GBLA  GBLL  GBLS  全局变量名 

GBLA  GBLL  GBLS 伪指令用于定义一个 ARM 程序中的全局变量,并将其初始化。其中: 

GBLA 伪指令用于定义一个全局的数字变量,并初始化为 0  

GBLL 伪指令用于定义一个全局的逻辑变量,并初始化为 F (假); 

GBLS 伪指令用于定义一个全局的字符串变量,并初始化为空; 

由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。 

使用示例: 

GBLA Test1 ;定义一个全局的数字变量,变量名为 Test1 

Test1 SETA 0xaa ;将该变量赋值为 0xaa 

GBLL Test2 ;定义一个全局的逻辑变量,变量名为 Test2 

Test2 SETL {TRUE} ;将该变量赋值为真 

GBLS Test3 ;定义一个全局的字符串变量,变量名为 Test3 

Test3 SETS “ Testing ” ;将该变量赋值为 “ Testing ” 

2. LCLALCLL LCLS 

语法格式: 

LCLA  LCLL  LCLS  局部变量名 

LCLA  LCLL  LCLS 伪指令用于定义一个 ARM 程序中的局部变量,并将 其初始化。其中: 

LCLA 伪指令用于定义一个局部的数字变量,并初始化为 0  

LCLL 伪指令用于定义一个局部的逻辑变量,并初始化为 F (假); 

LCLS 伪指令用于定义一个局部的字符串变量,并初始化为空; 

以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。 

使用示例: 

LCLA Test4 ;声明一个局部的数字变量,变量名为 Test4 

Test3 SETA 0xaa ;将该变量赋值为 0xaa 

LCLL Test5 ;声明一个局部的逻辑变量,变量名为 Test5 

Test4 SETL {TRUE} ;将该变量赋值为真 

LCLS Test6 ;定义一个局部的字符串变量,变量名为 Test6 

Test6 SETS “ Testing ” ;将该变量赋值为 “ Testing ” 

3. SETASETL SETS 

语法格式:

变量名 SETA  SETL  SETS  表达式 

伪指令 SETASETLSETS用于给一个已经定义的全局变量或局部变量赋值。 

SETA 伪指令用于给一个数学变量赋值; 

SETL 伪指令用于给一个逻辑变量赋值; 

SETS 伪指令用于给一个字符串变量赋值; 

其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。 

使用示例: 

LCLA Test3 ;声明一个局部的数字变量,变量名为 Test3 

Test3 SETA 0xaa ;将该变量赋值为 0xaa 

LCLL Test4 ;声明一个局部的逻辑变量,变量名为 Test4 

Test4 SETL {TRUE} ;将该变量赋值为真 

4. RLIST 

语法格式: 

名称 RLIST { 寄存器列表 } 

RLIST 伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在 ARM 指令 LDM/STM 中使用。在 LDM/STM 指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。 

使用示例: 

RegList RLIST {R0-R5  R8  R10} ;将寄存器列表名称定义为 RegList ,可在 ARM 指令 LDM/STM中通过该名称访问寄存器列表。 

阅读(2940) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~