首页　| 　博文目录　| 　关于我

博客访问： 1726184
博文数量： 511
博客积分： 967
博客等级：准尉
技术积分： 2560
用户组：普通用户
注册时间： 2012-07-06 14:19

文章分类

全部博文（511）

zynq（34）
rootfs（12）
ffmpeg（12）
uio（5）
bluetooth（1）
rt-thread（4）
linux 文件（5）
powerpc（1）
调试（7）
Netfilter（13）
性能（10）
安全代码思考（12）
算法（18）
linux-tcpip（70）
机器视觉（2）
应用（27）
linux 应用（78）
linux 启动（32）
bootloader（3）
Linux 内核（62）
未分配的博文（103）

文章存档

2016年（11）

2015年（61）

2014年（257）

2013年（63）

2012年（119）

我的朋友

本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念，然后是在GCC和ARMCC RVCT工具链下的具体编译参数。

2015-04-18 14:51 352人阅读评论(0) 举报

目前大多数CPU都支持浮点运算单元FPU，FPU作为一个单独的协处理器放置在处理器核外，但是对于嵌入式处理器，浮点运算本来就少用，有些嵌入式处理器就会去掉浮点协处理器。
X86处理器一般都是有FPU的。而ARM PPC MIPS处理器就会出现没有FPU的现象。

linux kernel如何处理浮点运算，我们就分为带FPU的处理器和不带FPU的处理器来讨论。

（以下为个人知识总结，研究不深，错误之处希望大家指正，共同学习）

一对于带FPU的处理器

1 对于linux kernel来说，kernel本身编译默认使用了-msoft-float选项，默认编译为软浮点程序，软浮点含义是有gcc编译器模拟浮点运算（glibc库提供），将浮点运算代码替换为定点运算。

对于带FPU的处理器，我们可以将编译选项-msoft-float去掉，一般是在arch/xxx/Makefile中。将kernel编译为硬浮点，也就是让处理器的浮点指令计算浮点，
硬浮点运算肯定要比模拟的定点运算效率高。（kernel代码中一般不会有浮点运算，所以效率影响不大）

2 对于运行在kernel上的app来说，特别是对于图形程序，如QT，浮点运算较多，我们直接编译即可，因为处理器支持浮点运算，支持浮点运算指令。

二对于不带FPU处理器

1 对于linux kernel来说，编译默认使用了-msoft-float选项，默认编译为软浮点程序，linux kernel编译不依赖链接任何库，kernel中来实现对应的模拟浮点ABI。

2 对于运行在kernel之上的app来说，如何处理浮点运算，这里就有2种方法了：

（1）由kernel来模拟软浮点.

应用程序使用硬浮点直接编译（编译器默认就是编译成硬浮点程序）。
而对于kernel，我所了解的PPC MIPS处理器都有专门的浮点运算异常处理，程序运行碰到浮点指令，无法运行浮点指令时，硬件会产生相应的中断异常，kernel浮点异常处理程序根据指令内容进行软浮点模拟操作，将运算结果返回之后再恢复到用户空间执行。
对于ARM我在其异常介绍中没有找到对于浮点计算的异常入口，但是kernel中也有对于其软浮点的支持，
在配置ARM Linux内核时，应该都会看到这样的配置：
menu "Floating point emulation"
comment "At least one emulation must be selected"
config FPE_NWFPE
...
这个是用来配置在内核里面模拟浮点处理器。
具体ARM如何实现支持异常模拟软浮点，具体实现有时间还需要仔细看代码，在arch/arm/nwfpe中。
这样的方式好处在于应用程序不需要重新编译，需要在kernel中把浮点模拟打开即可，使用起来非常方便。

但是缺点也很明显，每次浮点操作都要触发中断异常，用户空间和内核空间切换，执行效率太低。

（2）使用软浮点重新编译app
这样可以避免上述问题，app编译时需要连接glibc库的，使用--msoft-float，使用glibc的模拟浮点，替换为定点运算，这样的好处是运行性能上会好一些。
但缺点是因为使用了不同的编译选项，使用的ABI可能就发生了变化，如果某个库或者应用没有使用同样的编译选项（ABI不同），
系统运行时会出现意想不到的情况，甚至造成崩溃。

根据最近对PPC一款处理器的调试记录，kernel正常启动进入console后死在某一地址，用户空间浮点运算多，询问IC后得知FPU去掉，而处理器浮点异常没有使能。

这样遇到浮点指令，处理器不会触发异常，也不知道该如何运行该指令。

所以进行kernel移植时对于处理器有无FPU也要搞清楚，如果处理器去掉了FPU，而核没有做相应的处理（使能浮点异常），那么APP的浮点指令运行结果就是无法预测的，这时可以采用软浮点工具链来编译APP。

这里有一点思考：

对于一款处理器，处理器设计中有浮点异常（MIPS PPC都是），其外也可以接FPU。

在接FPU后，处理器核内就要屏蔽掉浮点异常，不然浮点运算还是产生浮点异常，FPU就没有实用意义了。

无FPU，则处理器核内要使能浮点异常，不然就跟我上面遇到的问题一样，处理器不知道该如何运行该浮点指令，结果就无法预测了。

1、首先是待make的程序：

#include 
#include 
#include 
#include 
 
int main(void)
{
   printf("Hello Makefile!\n");
   
   return 0;
}

2、其次就是其makefile了：

CC = $(CROSS_COMPILE)gcc
LD = $(CROSS_COMPILE)ld
STRIP = $(CROSS_COMPILE)strip
OBJCOPY = $(CROSS_COMPILE)objcopy
OBJDUMP = $(CROSS_COMPILE)objdump
AR = $(CROSS_COMPILE)ar
RANLIB = $(CROSS_COMPILE)ranlib
 
CURTDIR = $(shell pwd)
TARGET = my_make
 
%.o:%.c
       $(CC)-c $(EXTRAFLAGS) $< -o $@
%.o:%.S
       $(CC)-c $(EXTRAFLAGS) $< -o $@
 
.PHONY: all clean
 
$(TARGET): $(TARGET).o
       $(CC)  -o $@ $^
 
clean:
       rm-rf $(TARGET) $(TARGET).o

如果是要交叉编译的话，那么就如下：

CROSS_COMPILE =/usr/local/arm/4.2.2-eabi/usr/bin/arm-linux-
 
CC = $(CROSS_COMPILE)gcc
LD = $(CROSS_COMPILE)ld
STRIP = $(CROSS_COMPILE)strip
OBJCOPY = $(CROSS_COMPILE)objcopy
OBJDUMP = $(CROSS_COMPILE)objdump
AR = $(CROSS_COMPILE)ar
RANLIB = $(CROSS_COMPILE)ranlib
 
CURTDIR = $(shell pwd)
ROOTDIR = $(CURDIR)/../..
TARGET = my_make
 
#CFLAGS = -I$(ROOTDIR)/src/inc -EL
#LDFLAGS = -EL -L$(ROOTDIR)/lib -lled
CFLAGS = -I$(ROOTDIR)/src/inc
LDFLAGS = -L$(ROOTDIR)/lib -lled
 
%.o:%.c
       $(CC)-c $(CFLAGS) $(EXTRAFLAGS) $< -o $@
%.o:%.S
       $(CC)-c $(CFLAGS) $(EXTRAFLAGS) $< -o $@
 
.PHONY: all clean
 
$(TARGET): $(TARGET).o
       $(CC)$(LDFLAGS) -o $@ $^
 
clean:
       rm-rf $(TARGET) $(TARGET).o

以上是编译成可执行文件的，如果要编译成.so文件呢？那么其makefile要怎么实现呢？

1、首先是最外面的makefile了

CROSS_COMPILE=/usr/local/arm/4.2.2-eabi/usr/bin/arm-linux-
 
CC =$(CROSS_COMPILE)gcc
LD =$(CROSS_COMPILE)ld
STRIP =$(CROSS_COMPILE)strip
OBJCOPY =$(CROSS_COMPILE)objcopy
OBJDUMP =$(CROSS_COMPILE)objdump
AR =$(CROSS_COMPILE)ar
RANLIB =$(CROSS_COMPILE)ranlib
 
ROOTDIR =$(shell pwd)
INCLUDEDIRS =-I$(ROOTDIR)/inc
 
#LIB_DIR =/opt/mips-linux-gnu-4.3.-51/mips-linux-gnu/libc/el/usr/lib
 
#CFLAGS = -O0-g3 -EL -Wall $(INCLUDEDIRS) -mhard-float -fPIC
CFLAGS = -O0 -g3-EL -Wall $(INCLUDEDIRS) -fPIC
AFLAGS = -O0 -g3-EL -Wall $(INCLUDEDIRS) -mmt -fPIC
LDFLAGS = -EL-fPIC -shared -LLIB_DIR -lm -lpthread -lc -ldl
 
export CC LDSTRIP OBJCOPY OBJDUMP AR RANLIB CFLAGS LDFLAGS AFLAGS INCLUDEDIRS ROOTDIR
 
.PHONY : all
 
all    : childdir
 
childdir:
@for dir in $(SUB_DIRS); do \
        $(MAKE) -C $$dir || exit 1;\
done
 
SUB_DIRS = led
 
install:
mkdir -p ../lib
mkdir -p ../module
 
dep:
@for dir in $(SUB_DIRS); do \
                $(MAKE) -C $$dir dep; \
done
 
clean:
@for dir in $(SUB_DIRS); do\
        $(MAKE) -C $$dir clean; \
done

然后是其Rules.make

$(MODULE) : $(OBJFILE) $(LLIBS)
       @echo[LD] $@
       $(CC)$(LDFLAGS) -o $(MODULE) $(OOBJFILE)
       mv$(MODULE) $(ROOTDIR)/../lib
 
%.o:%.c
       $(CC)-c $(CFLAGS) $(EXTRAFLAGS) $< -o $@
%.o:%.S
       $(CC)-c $(CFLAGS) $(EXTRAFLAGS) $< -o $@
 
dep:
       $(CC)$(INCLUDEDIRS) -M $(SRC) > ./depend.mk
 
clean:
       rm-rf $(OBJFILE)
       rm-rf $(MODULE)
       rm-rf depend.mk
 
-include ./depend.mk

接着你要编译的程序，比如上面的那个程序。

MODULE = libmy_make.so
 
SRS = $(wildcard *.S)
SRC = my_make.c
 
OBJFILE = $(SRC:%.c=%.o) $(SRS:%.S=%.o)
 
include $(ROOTDIR)/Rules.make

阅读(4693) | 评论(0) | 转发(0) |

上一篇：ARM Linux Oops使用小结

下一篇：使用initramfs启动Linux

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

Manufacturerhttp://houh-1984.blog.163.com/	SoC	architecture	VFP	SIMD	Notes
Freescale	iMX5x	armv7			; only reliable in Tape-Out 3 or above
Nvidia	Tegra2	armv7		none
Marvell	Dove	armv7		iwMMXt
Texas Instruments	OMAP3xxx	armv7
Texas Instruments	OMAP4xxx	armv7
	OMAP5xxx	armv7	VFPv4		(ARMv7-A) + (ARMv7-ME)
Qualcomm	Snapdragon	armv7		[1]	Qualcomm "Scorpion" core
	S5PC100	armv7
	A1x	armv7