Chinaunix首页 | 论坛 | 博客
  • 博客访问: 203185
  • 博文数量: 68
  • 博客积分: 529
  • 博客等级: 中士
  • 技术积分: 721
  • 用 户 组: 普通用户
  • 注册时间: 2007-08-10 16:38
文章分类

全部博文(68)

文章存档

2014年(2)

2013年(4)

2012年(16)

2011年(34)

2010年(4)

2009年(8)

分类: 嵌入式

2013-12-11 17:38:38

1) An embedded GPU core excecutes multiple threads but all threads run the same set of instruction,operating on different data
      所有的线程执行同样的代码但是不同的数据

2) 基于嵌入式GPU的图形处理

2.1 内存传输带宽
2.2 GPU更适合浮点运算如Gaussian filter
2.3 shader 指令数目和渲染次数


5.性能优化
5.1 浮点精度
hightp: 单精度32为浮点值
mediump: half-precision floating point value(16bit) -65520,65520
lowp: 【-2.0 2.0 精度为1/256


5.2 loop unrolling
用vector
5.3 分支
极大的恶化了性能

5.4  load sharing between vetex and fragment shaders

by moving the calculations to the vertx shader and directly using the vertx shader's computed texture coordinates , the fragment shader avoids the dependent texture read

output from the vertex shader is represented by varying modifier which is first interpolated by the rasterizer and then fed into the fragment shader.




阅读(796) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~