原文链接:http://comcat.blog.openrays.org/blog-htm-do-showone-tid-329.html
1. GCC 内嵌汇编的基本格式
asm("assembly code");
如:
asm("syscall"); //触发一个系统调用
如果有多条指令,则需在指令尾部添加'\t'和'\n',如:
asm("li v0, 4011\t\n" "syscall");
括号里的字符串 GCC 前端不作分析,直接传给汇编器 as ,故而相联指令间需插入换行符。
'\t' 加入只为排版对齐一些而已,可以使用 gcc -S tst.c -o tst.s 查看生成的 tst.s
因为 GCC 并不对 asm 后括号中的指令作分析,故而如果指令修改一些的寄存器的值,GCC是
不知道的,这个会引入一些问题。
另外 asm 可以替换为 __asm__ ,效果等价。__asm__ 一般用于头文件中,防止关键字 asm
可能与一些变量、函数名冲突。
内嵌汇编如何与 C 变量交换数据?
2. GCC 内嵌汇编扩展格式
asm (
"assembly code"
: output_operand /* 输出参数列表 */
: input_operand /* 输入参数列表 */
: clobbered_operand /* 被改变的操作对象列表 */
);
以一个例子来说明:
如果我们要读取CP0 25 号硬件计数寄存器的值,并返回之,可以这样:
int get_counter()
{
int rst;
asm( /* mfc0 为取cp0 寄存器值的指令 */
"mfc0 %0, $25\t\n" /* %0 表示列表开始的第一个寄存器 */
: "=r" (rst) /* 告诉gcc 让rst对应一个通用寄存器 */
);
return rst;
}
"=r" 中,'=' 为修饰符,表示该操作对象只写,一般用于修饰输出参数列表中。'r' 表示任意
一个通用寄存器。
由于我们只要取得一个值,故而只用到了输出列表。代码中也没修改一些寄存器的值gcc不知道,
(输出、输入列表中的寄存器gcc是知道的)故而被改变的操作对象列表亦可省去。
此处添加一个小例子(两个数相加):
#include
#include
int main(int argc,char ** argv)
{
int a,b,c;
a = 5;
b = 6;
c = 0;
// c = a + b;
/*
%0 表示列表开始的第一个寄存器 即为 c
%1 表示列表开始的第二个寄存器 即为 a
%2 表示列表开始的第三个寄存器 即为 b
列表寄存器顺序为 c(0),a(1),b(2),从上往下数
"=r" 中,'=' 为修饰符,表示该操作对象只写,一般用于修饰输出参数列表中。'r' 表示任意一个通用寄存器。
*/
asm(
"add %0,%1,%2"
:"=r"(c)
:"r"(a),"r"(b)
);
printf("%d + %d = %d \n",a,b,c);
return 0;
}
如果我们要重设CP0 24 号硬件计数器之控制寄存器的值,则:
unsigned int op = 0x80f;
asm volatile(
"mtc0 %0, $24"
: /* 没有输出,列表为空 */
:"r"(op) /* 输入参数,告诉gcc 让op对应一个通用寄存器 */
);
volatile 关键字表示让GCC优化生成代码时,不要移动、删除我们的汇编码。
另外 __volatile__与其含义相同,引入的目的与__asm__是一样的。
如果我们重设后,立即读取CP0 24号寄存器的值,则:
unsigned int rst;
unsigned int op = 0x80f;
asm volatile(
"mtc0 %1, $24\t\n" /* %1 表示 op 对应的寄存器 */
"mfc0 %0, $25\t\n" /* %0 表示 rst 对应的寄存器 */
: "=r" (rst)
: "r" (op)
);
如果我们要操作的对象位于存储器中,我们可以使用 'm' 来修饰输入输出参数,如:
unsigned short data[] = {
0x0, 0x0, 0x0, 0x0,
0x1, 0x3, 0x5, 0x7,
0x1, 0x3, 0x5, 0x7,
};
void pmullh()
{
asm volatile
(
".set mips3\n\t"
".set noreorder\n\t"
"ldc1 $f0, %1\n\t" /* 取 data+4 处的四个数组元素值到 f0 中 */
"ldc1 $f2, %2\n\t" /* 对应输入列表的 *(data+8) */
/* %2 编译后会替换成类似 16($12) 的形式 */
"pmullh $f2, $f2, $f0\n\t" /* 按16位为单位数据相乘,取结果的低位 */
"sdc1 $f2, %0\n\t" /* 将结果写入data的前四个位置 */
".set reorder\n\t"
".set mips0\n\t"
: "=m"(*data)
: "m"(*(data+4)), "m"(*(data+8))
: "$f0", "$f2", "memory"
);
}
注意到使用'm'修饰的操作数,后面括号里跟的不是指针,而是开始的第一个元素值。
%0,%1, %2 依次对应输出列表的一个,输入列表的两个操作数,编译后会被gcc替换
成类似 0($12),8($12),16($12)的形式,其中$12置数组首地址,即: %0等价于0($12)
由于我们嵌入的代码改变了 $f0, $f2 的值,而他们不在输出、输入列表中,故而要将其陈列
于被改变操作数列表(clobbered operand list)中,以告诉gcc 我们改变了他们的值,以免gcc 误判。
因为代码中我们改变了内存中数据的值,如果此前gcc生成的代码读取了该内存处的值,并保
存于寄存器中的话,由于我们更新了这段数据,所以需要告诉gcc在后面要重新加载数据,这
个需要在被改变操作数列表中(clobbered operand list)写入 "memory"。
一个一次复制8个字节的小例子:
#include
#include
#include
void * my_memcopy(char * b,char *a)
{
asm(
"lw $8,%2\t\n"
"lw $9,%3\t\n"
"sw $8,%0\t\n"
"sw $9,%1\t\n"
:"=m"(*b),"=m"(*(b+4))
:"m"(*a),"m"(*(a+4))
:"$8","$9","memory"
);
printf("a: %s\nb: %s\n",a,b);
return b;
}
int main(int argc,char ** argv)
{
char *a,*b;
a = "hello,world";
b = malloc(sizeof(a));
my_memcopy(b,a);
printf("a: %s\nb: %s\n",a,b);
b = NULL;
free(b);
return 0;
}
3. 修饰符
= 只写,常用于修饰所有输出操作数
+ 只读
& 只用于输出,一般和'='一起用,如:"=&r" (val)
4. 其他对输入、输出对象的操作符
可以参看gcc doc 之 5.36 节(Constraints for `asm' Operands)获取更多信息,下面列出MIPS 平台专用的操作符:
`d'
General-purpose integer register
`f'
Floating-point register (if available)
`h'
`Hi' register
`l'
`Lo' register
`x'
`Hi' or `Lo' register
`y'
General-purpose integer register
`z'
Floating-point status register
`I'
Signed 16-bit constant (for arithmetic instructions)
`J'
Zero
`K'
Zero-extended 16-bit constant (for logic instructions)
`L'
Constant with low 16 bits zero (can be loaded with `lui')
`M'
32-bit constant which requires two instructions to load (a
constant which is not `I', `K', or `L')
`N'
Negative 16-bit constant
`O'
Exact power of two
`P'
Positive 16-bit constant
`G'
Floating point zero
`Q'
Memory reference that can be loaded with more than one
instruction (`m' is preferable for `asm' statements)
`R'
Memory reference that can be loaded with one instruction (`m'
is preferable for `asm' statements)
`S'
Memory reference in external OSF/rose PIC format (`m' is
preferable for `asm' statements)
5. 32位下传递64位数据
A. 读取:
long long counter;
asm(
".set mips3\n\t"
"dmfc0 %M0, $25\n\t"
"dsll %L0, %M0, 32\n\t"
"dsrl %M0, %M0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
".set mips0\n\t"
: "=r" (counter)
);
B. 写入
long long counter = 0x0000001000000100;
asm(
".set mips3\n\t"
"dsll %L0, %L0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
"dsll %M0, %M0, 32\n\t"
"or %L0, %L0, %M0\n\t"
"dmtc0 %L0, $25\n\t"
".set mips0\n\t"
: "=r" (counter)
);
阅读(1163) | 评论(0) | 转发(1) |