玩转pandaboard之linaro对于Android的编译上的一些优化-garyybl-ChinaUnix博客

DDUP-Day Day Upgaryybl.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

garyybl

博客访问： 3118131
博文数量： 674
博客积分： 17881
博客等级：上将
技术积分： 4849
用户组：普通用户
注册时间： 2010-03-17 10:15

文章分类

全部博文（674）

Windows（0）
项目管理（0）
数据结构（3）

链表（0）

kfifo（3）
DEFY刷机（8）
pandaboard（10）
硬件知识（1）
编程语言（11）

C语言（10）
文件系统（17）
系统管理（54）

版本管理（16）
DSP（0）
业界新闻（2）
FPGA（3）
misc（17）
网络开发（18）
移植（40）

SSH（2）

系统移植（4）

驱动移植（3）

流媒体（4）

WebServer（3）

DHCP（3）

软件移植（9）

Android移植（10）
工具命令（9）
Linux Driver（200）

调试（1）

GPU（2）

FDT（0）

MIPI（2）

smd（1）

hdmi（3）

PMIC（1）

DDR（0）

DMA（6）

3G（10）

电源管理（30）

Bluetooth（4）

Input（2）

WIFI（34）

Flash（9）

Uart（7）

SPI（0）

I2C（2）

Audio（11）

SD（14）

LCD（8）

Camera（2）

TouchScreen（19）

USB（28）

启动顺序（4）
Andriod（88）

NDK（2）

Audio（6）

Android开发（34）

Android应用（18）

Andord驱动（18）
读书笔记（47）

深入理解LINUX内（2）

By 张斌（8）

By 卿子（16）

内核设计与实现（0）

LDD_Tekkaman Nin（21）

LDD（0）
BootLoader（11）
Linux Kernel（108）

通知链（4）

Kbuild（1）

系统调用（2）

参数传递（3）

并发&同步（1）

内存管理（19）

内核启动（44）

中断机制（17）

Timer&Clock（17）
未分配的博文（27）

文章存档

2013年（34）

2012年（146）

2011年（197）

2010年（297）

我的朋友

相关博文

玩转pandaboard之linaro对于Android的编译上的一些优化

分类： LINUX

2012-08-02 18:23:25

之前看ELC2011的video轮播, 其中有Linaro发表的关于android platform的section, 其中说到了linaro对于android做了一些优化,尤其是编译上的. 这里就总结下其中提到的内容及相关概念.

首先,来看一下Linaro对AOSP的具体做了哪些优化:

使用O3代替了O2

关闭了默认的-fno-strict-aliasing, 新增-fmodulo-sched, -fmodulo-shed-allow-regmores, -Wl -hash-style=gnu -Werror=strict-aliasing

O3时默认开启一下高级选项: -finline-functions, -funcswitch-loops, -fpredictive-commoning, -fgcse-after-reload, -ftree-rectorize, -fipa-cp-clone

对一些模块开启了-ffast-math

为Cotex-A8/A9的SoC做了特殊优化

对于采用Graphite的优化: -fgraphite-identity, -floop-block, -floop-interchange, -floop-strip-mine, -ftree-loop-distribution, -ftree-loop-linear

对multi-core SoC的OpenMP优化: -ftree-parallelize-loops

对binutils: -Bsymbolic-functions, -flto, -fwhile-program

对gcc的优化: -fvisibility-inlines-hidden(优化启动时间), 增加对gcc 4.7的支持

接下来, 再看看各个优化措施的内涵:

初识O1, O2, O3
生成的代码performance: O3 > O2 > O1, 但是O3有可能引入一些性能退化. 同时, O3以效率为先, 可能导致生成的代码规模扩大并耗费更多的编译时间
对于O3, 开启了vectorizer, NEON unit, Swing Modulo Scheduling (SMS)
GCC vectoriser: 通过分析代码, 从写可以提高并行性的代码, 并把它们转换为可供NEON执行的格式(embedded GPU编程 ).
: 识别可能会有高延迟的代码(如,会有一些IO操作, 或者寄存器的交叉引用), 重写为三步曲(pre, median, post), 从而提高并行性, 提高效率

-fmodulo-sched, -fmodulo-shed-allow-regmoves
是打开SMS之后,与之相对的两个优化. 主要针对一些循环内部的寄存器使用优化及reorder

-Wl -hash-style=gnu
使用新的GNU Linker优化, 代替老的sysv. 参见. 同时我整理的<拜读大牛Ulrich Drepper大作之How To Write Shared Libraries>就有相关描述.
提高了动态库的加载速度

-Werror=strict-aliasing
优化导致的strict-aliasing警告,会作为error报告.

一些O3默认打开的优化选项
-finline-functions, 编译器判断是否有些函数可以编译为inline
-funswitch-loops, 把loop中有的branch通过拆分成多个loop而提炼出来
-fpredictive-commoning, 优化循环的迭代
-fgcse-after-reload, 优化reload的次数
-ftree-vectorize, 优化loop的并行性
-fipa-cp-clone, 正对有些函数的参数会是constant而做的优化
...

-ffast-math
打开了‘-fno-math-errno’, ‘-funsafe-math-optimizations’, ‘-ffinite-math-only’,‘-fno-rounding-math’, ‘-fno-signaling-nans’ and ‘-fcx-limited-range’.
在一些不需要符合IEEE or ISO的数学函数时,会生成更快的代码
在linaro的实现中(截至4.0.3),以下模块打开了-ffast-math的编译选项
主要是2d/3d处理的相关library: opengl, libpng, x264等external目录下的代码

开启了对于graphite的相关优化
关于graphite, 参见
它是gcc的一种内部表示,用以更好表示一些中间信息

额外的一些针对动态链接的优化
-Bsymbolic-functions, 通过影响对应的symbolic的visible属性优化gnu ld的动作. 参考及
-fwhile-program, -flto, 参见中的相关描述
-fvisibility-inlines-hidden, 同样是通过影响动态库中的导出表的大小来影响加载的速度. 参见

正对多核的优化
-ftree-parallelize-loops=n, 使得一些需要CPU过的参与的循环能够在多个CPU中执行.

其它关于android optimization的资料:

    http://www.linaro.org/linaro-blog/2011/10/10/compiling-with-gcc-o3/
    http://www.linaro.org/linaro-blog/2011/10/25/compiler-flags-used-to-speed-up-linaro-android-2011-10-and-future-optimizations/

    http://elinux.org/images/0/02/Android_Platform_Optimizations_SNPS_20111027.pdf
    http://elinux.org/images/d/de/ELCE_2011_-_BZ_-_Embedded_Linux_Optimization_Techniques_-_How_Not_to_Be_Slow.pdf

关于GNU 优化的资料:
Ulrich Drepper, Optimizing Applications with gcc & glibc; Application Optimization on Linux Tutorial Material

http://blog.csdn.net/melody_lu123/article/details/7220386

阅读(2116) | 评论(0) | 转发(1) |

上一篇：玩转pandaboard之rootfs制作及启动

下一篇：pandaboard与beagleboard的NFS,TFTP,以及dhcp服务设置

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6