真彩色转成高彩色的快速算法-shark888-ChinaUnix博客

大白鲨

首页　| 　博文目录　| 　关于我

shark888

博客访问： 1715116
博文数量： 585
博客积分： 14610
博客等级：上将
技术积分： 7402
用户组：普通用户
注册时间： 2008-05-15 10:52

文章分类

全部博文（585）

报表编程（2）
软件架构与设计（16）
网络应用/路由/安（27）
嵌入开发/CCD/Lin（21）
系统应用（12）

虚拟机应用（10）

window（2）
OpenSource（9）
VC编程技巧（37）
多线程编程（9）
图像处理与识别(（24）
网络编程（41）
C/C++ /VC（19）
OpenGL/OpenGv（2）
Web开发（3）
VC编程（95）

自定义组件（5）

基本组件（0）
算法&加密与解密（39）
Java（4）

JSP/Server（0）

数据库应用（2）
数据库管理/开发（13）
游戏开发&多媒体（4）
项目管理（5）
软件工程（50）
软件测试（2）
招聘（3）
未分配的博文（148）

文章存档

2013年（5）

2012年（214）

2011年（56）

2010年（66）

2009年（44）

2008年（200）

我的朋友

相关博文

真彩色转成高彩色的快速算法

分类： C/C++

2009-07-11 13:07:56

真彩色转成高彩色的快速算法

为什么要实时转换颜色深度?

通常, 2D 游戏中的位图, 无论在外存中按什么颜色深度存放, 加栽后都被转换成了需要的颜色深度. 我们不太注意颜色深度转换说需要的时间.

但是, 现在不同了. 云风未来的计划中, 最重要的一项是制作一个超级 2D 引擎. 将支持 Voxel 物体和实时光线处理这样的特性, 而且在光线处理中, 32 级的光线亮度级别也远远不够, 所以, 未来的 2D 游戏的发展趋势应该是采用真彩色, 至少是在内部运算时使用. 在某些场合下, 我们可能需要做 15/16bit 高彩色的输出, 所以有必要找到更快的方法实时处理.

下面, 我们对此做一些探讨, 虽然显卡可以支持 15 或 16 bit 色中的一种, 但这里全部用 16bit 色举例:

先来看看 C 版本:

red=(truecolor>>8)&0xf800; green=(truecolor>>5)&0x7e0; blue=(truecolor>>3)&0x1f; hicolor=red|green|blue; 这样当然是相当慢的, 所以我们还是要借助汇编. 而汇编能极大的优化它:lodsd ;RRRRRRRR GGGGGGGG BBBBBBBB shr eax,3 ;000RRRRR RRRGGGGG GGGBBBBB shl al,2 ;000RRRRR RRRGGGGG GBBBBBxx shl ax,3 ;000RRRRR GGGGGGBBB BBxxxxx dec esi shr eax,5 ;00000000 RRRRRGGG GGGBBBBB stosw 是不是精简了很多? 但不幸的是, 虽然看起来很简洁, 但由于大量使用部分寄存器, 对流水线的冲击很大. 代码几乎把流水线的效率减到了最低. 优化方案很多, 我们可以在一次循环里处理两个点, 分别使用 eax 和 ebx, 然后交错那些代码; 又或者将上面代码的后半部分改为查表, 相信都能提高速度. 但是下面我还想提出另一种方案, 采用 MMX 指令级:mm7=F800F800F800F800 mm6=FC00FC00FC00FC00 ------------------------------ punpcklbw mm0,[red+edx] ;mm0=RRRRRRRR 00000000 RRRRRRRR 00000000 RRRRRRRR 00000000 RRRRRRRR 00000000 punpcklbw mm1,[green+edx] ;mm1=GGGGGGGG 00000000 GGGGGGGG 00000000 GGGGGGGG 00000000 GGGGGGGG 00000000 punpcklbw mm2,[blue+edx] ;mm2=BBBBBBBB 00000000 BBBBBBBB 00000000 BBBBBBBB 00000000 BBBBBBBB 00000000 pand mm0,mm7 ;mm0=RRRRR000 00000000 RRRRR000 00000000 RRRRR000 00000000 RRRRR000 00000000 pand mm1,mm6 ;mm1=GGGGGG00 00000000 GGGGGG00 00000000 GGGGGG00 00000000 GGGGGG00 00000000 psrlw mm2,11 ;mm2=00000000 000BBBBB 00000000 000BBBBB 00000000 000BBBBB 00000000 000BBBBB psrlw mm1,5 ;mm1=00000GGG GGG00000 00000GGG GGG00000 00000GGG GGG00000 00000GGG GGG00000 por mm0,mm2 por mm0,mm1 ;mm0=RRRRRGGG GGGBBBBB RRRRRGGG GGGBBBBB RRRRRGGG GGGBBBBB RRRRRGGG GGGBBBBB movq [dis+edx*2],mm0 add edx,4 我们对 MMX 的运用是针对它的并行运算, 直接从 RGB888 格式利用并行处理变成 RGB565 似乎不可能, 但是, 如果我们将 RGB 三个色素分开存放, 就将其变为了可能. 可以同时读入 4 个色素, 并行处理, 然后合并, 这样便在一个循环内处理了 4 个点. 考虑到 CACHE 的效率, 最好不要将 RGB 三块内存分的太开. 我的建议是, 位图的每一行分成三个部分, 即为 Red 段, Green 段和 Blue 段.

上面的方法都是可以继续优化的, 本文旨在启发朋友们的灵感, 找出更好的方法.

阅读(717) | 评论(0) | 转发(0) |

上一篇：创建分层窗口，实现图像渐变

下一篇：地图比例尺绘制

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6