Chinaunix首页 | 论坛 | 博客
  • 博客访问: 150094
  • 博文数量: 34
  • 博客积分: 2000
  • 博客等级: 大尉
  • 技术积分: 410
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-03 09:44
文章分类

全部博文(34)

文章存档

2011年(1)

2008年(33)

我的朋友

分类: LINUX

2008-07-22 14:06:36

当前版本: 0.3


1. GCC 内嵌汇编的基本格式

asm("assembly code");

如:

       asm("syscall");       //触发一个系统调用


如果有多条指令,则需在指令尾部添加'\t'和'\n',如:

       asm("li       v0, 4011\t\n" "syscall");


括号里的字符串 GCC 前端不作分析,直接传给汇编器 as ,故而相联指令间需插入换行符。

'\t' 加入只为排版对齐一些而已,可以使用 gcc -S tst.c -o tst.s 查看生成的 tst.s

因为 GCC 并不对 asm 后括号中的指令作分析,故而如果指令修改一些的寄存器的值,GCC是
不知道的,这个会引入一些问题。

另外 asm 可以替换为 __asm__ ,效果等价。__asm__ 一般用于头文件中,防止关键字 asm
可能与一些变量、函数名冲突。      

内嵌汇编如何与 C 变量交换数据?


2. GCC 内嵌汇编扩展格式

asm (        
              "assembly code"
              : output_operand                     /* 输出参数列表 */
              : input_operand                            /* 输入参数列表 */
              : clobbered_operand                     /* 被改变的操作对象列表 */
       );


以一个例子来说明:

如果我们要读取CP0 25 号硬件计数寄存器的值,并返回之,可以这样:

int get_counter()
{
       int rst;

       asm(                                                 /* mfc0 为取cp0 寄存器值的指令 */
              "mfc0       %0, $25\t\n"              /* %0 表示列表开始的第一个寄存器 */
              : "=r" (rst)                            /* 告诉gcc 让rst对应一个通用寄存器 */
              );

       return rst;
}


"=r" 中,'=' 为修饰符,表示该操作对象只写,一般用于修饰输出参数列表中。'r' 表示任意
一个通用寄存器。

由于我们只要取得一个值,故而只用到了输出列表。代码中也没修改一些寄存器的值gcc不知道,
(输出、输入列表中的寄存器gcc是知道的)故而被改变的操作对象列表亦可省去。


如果我们要重设CP0 24 号硬件计数器之控制寄存器的值,则:

    unsigned int op = 0x80f;

       asm volatile(
                                   "mtc0 %0, $24"
                                   :                            /* 没有输出,列表为空 */
                                   :"r"(op)              /* 输入参数,告诉gcc 让op对应一个通用寄存器 */
                            );


volatile 关键字表示让GCC优化生成代码时,不要移动、删除我们的汇编码。
另外 __volatile__与其含义相同,引入的目的与__asm__是一样的。


如果我们重设后,立即读取CP0 24号寄存器的值,则:

       unsigned int rst;
    unsigned int op = 0x80f;

       asm volatile(
                                   "mtc0       %1, $24\t\n"       /* %1 表示 op 对应的寄存器 */
                                   "mfc0       %0, $25\t\n"       /* %0 表示 rst 对应的寄存器 */
                                   : "=r" (rst)
                                   : "r" (op)
                            );



如果我们要操作的对象位于存储器中,我们可以使用 'm' 来修饰输入输出参数,如:

unsigned short data[] = {
    0x0, 0x0, 0x0, 0x0,
    0x1, 0x3, 0x5, 0x7,
    0x1, 0x3, 0x5, 0x7,
};

void pmullh()
{
       asm volatile
         (
              ".set mips3\n\t"
              ".set noreorder\n\t"

              "ldc1 $f0, %1\n\t"                     /* 取 data+4 处的四个数组元素值到 f0 中 */
              "ldc1 $f2, %2\n\t"                     /* 对应输入列表的 *(data+8)       */
                                                               /* %2 编译后会替换成类似 16($12) 的形式 */
                                                               

              "pmullh $f2, $f2, $f0\n\t"       /* 按16位为单位数据相乘,取结果的低位 */

              "sdc1 $f2, %0\n\t"                     /* 将结果写入data的前四个位置 */

              ".set reorder\n\t"
              ".set mips0\n\t"

              : "=m"(*data)
              : "m"(*(data+4)), "m"(*(data+8))
              : "$f0", "$f2", "memory"
         );
}


注意到使用'm'修饰的操作数,后面括号里跟的不是指针,而是开始的第一个元素值。
%0,%1, %2 依次对应输出列表的一个,输入列表的两个操作数,编译后会被gcc替换
成类似 0($12),8($12),16($12)的形式,其中$12置数组首地址,即: %0等价于0($12)

由于我们嵌入的代码改变了 $f0, $f2 的值,而他们不在输出、输入列表中,故而要将其陈列
于被改变操作数列表(clobbered operand list)中,以告诉gcc 我们改变了他们的值,以免gcc 误判。

因为代码中我们改变了内存中数据的值,如果此前gcc生成的代码读取了该内存处的值,并保
存于寄存器中的话,由于我们更新了这段数据,所以需要告诉gcc在后面要重新加载数据,这
个需要在被改变操作数列表中(clobbered operand list)写入 "memory"。


3. 修饰符

=        只写,常用于修饰所有输出操作数      
+        只读
&        只用于输出,一般和'='一起用,如:"=&r" (val)


4. 其他对输入、输出对象的操作符

可以参看gcc doc 之 5.36 节(Constraints for `asm' Operands)获取更多信息,下面列出MIPS 平台专用的操作符:

    `d'
          General-purpose integer register

    `f'
          Floating-point register (if available)

    `h'
          `Hi' register

    `l'
          `Lo' register

    `x'
          `Hi' or `Lo' register

    `y'
          General-purpose integer register

    `z'
          Floating-point status register

    `I'
          Signed 16-bit constant (for arithmetic instructions)

    `J'
          Zero

    `K'
          Zero-extended 16-bit constant (for logic instructions)

    `L'
          Constant with low 16 bits zero (can be loaded with `lui')

    `M'
          32-bit constant which requires two instructions to load (a
          constant which is not `I', `K', or `L')


    `N'
          Negative 16-bit constant

    `O'
          Exact power of two

    `P'
          Positive 16-bit constant

    `G'
          Floating point zero

    `Q'
          Memory reference that can be loaded with more than one
          instruction (`m' is preferable for `asm' statements)

    `R'
          Memory reference that can be loaded with one instruction (`m'
          is preferable for `asm' statements)

    `S'
          Memory reference in external OSF/rose PIC format (`m' is
          preferable for `asm' statements)


5. 32位下传递64位数据

    A. 读取:

    long long counter;
    asm(
            ".set mips3\n\t"
            "dmfc0  %M0, $25\n\t"
            "dsll   %L0, %M0, 32\n\t"
            "dsrl   %M0, %M0, 32\n\t"
            "dsrl   %L0, %L0, 32\n\t"
            ".set mips0\n\t"
            : "=r" (counter)
       );


    B. 写入

    long long counter = 0x0000001000000100;

    asm(
            ".set mips3\n\t"

            "dsll   %L0, %L0, 32\n\t"
            "dsrl   %L0, %L0, 32\n\t"
            "dsll   %M0, %M0, 32\n\t"
            "or    %L0, %L0, %M0\n\t"
            "dmtc0  %L0, $25\n\t"
            ".set mips0\n\t"
            : "=r" (counter)
       );
阅读(2800) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~