数码相机的出现和发展正在深刻的影响着人们的日常生活。也许将来某一天数码相机的画质会赶上并超过传统胶片相机,但数码相机的根本优势并不在此,而是和其他数字信息产品一样,在于信息的无损存储/复制/传输和后续处理。例如,数字照片和视频可以方便的通过互联网传播,而其和计算机相联接则可实现机器视觉来实现诸如导弹视频制导,交通智能管理,产品缺陷的自动检测等。
色彩对于很多机器视觉应有并不重要,但对于人类消费者来说色彩是一个重要的因素。为了模拟人眼的三色视觉原理,彩色的数字相机需要采集三个颜色通道(通常是RGB)的信息。而其实现通常如下:
1)分时。
既对每一幅图像进行3次曝光,每次在感光元件前分别放置不同的颜色滤镜。其缺点是活动机械部件影响系统的复杂性和可靠性,不适合于拍摄高速活动目标。这种系统在早期有过应用,现在则很少见了。
2)3传感器。
通过分色镜将红绿蓝成分分离并投射到不同的3个传感器上。这种方式可以获得极佳的色彩分离和空间分辨率。但是需要很高的成本:额外的传感器和分色镜。传感器精密装配也是个技术难题:对于10x10um像素的传感器,定位精度可能要求小于1um。而且由于镜头和传感器之间增加的距离,镜头的色散会变得更加明显。
3)彩色滤片(color
filter array)。
常见的如bayer
pattern。在任一像素,实际上只有一个颜色通道的信息被采集,其他的信息都被丢掉了。而颜色的还原是靠插值运算来完成的。优点在于低成本,而缺点也很明显,低采样率造成细节的丢失和颜色混叠(aliasing)。
4)多层传感器。
利用原理是硅所吸收光波长随着光子能量而变化,即在不同深度的PN结吸收不同颜色的光。Kodak公司早在70年代就开始了这样的实验,但由于当时制造工艺的问题而以失败告终。最近较为流行的Foveon X3就是这样一个传感器,优点:单一传感器,每一像素都获取了三个颜色通道的信息。缺点:较大的像素尺寸造成同样尺寸的像素数量较低,三个颜色通道之间的串扰严重。
在Foveon进一步完善他们的设计和进一步降低成本之前,采用bayer
pattern设计的相机还会占据主导地位。具体的插值算法都是各个公司的重要商业机密,但我们可以从一些公开发表的学术论文上了解一下常用的几种算法。
| | | |
原始图像 | 双线性 | Ron Kimmel | Optimal Recovery |
1)双线性(bilinear)这是最简单和古老的一种方法。
任何一像素的缺失颜色都用最临近的的4个同颜色像素进行双线性插值。
对于丢失的绿色:G8=(G3+G7+G9+G13)/4
对于丢失的红色:R8=(R2+R4+R12+R14)/4
对于丢失的蓝色:B12=(B6+B8+B16+B18)/4
缺点:双线性插值的本质是一低通滤波器,造成边缘模糊,没有考虑颜色混叠。该算法在最早期的数码相机中曾有过应用。
2)Ron
Kimmel
该算法核心思想是假设在物体内部比值R/G和B/G恒定,而在边缘则产生变化。在绿色像素,计算该点在各个方向的梯度,然后用梯度值作为权重进行加权平均。而对红色和蓝色像素,则利用它们对绿色的比值进行加权平均。该算法显著改善了物体边缘的颜色混叠。
3)Optimal
Recovery
仍然是基于对边缘向量的估计,只是估计方法更为复杂。具体计算比较繁复,感兴趣者可参见[1]。对于8M像素的图像,需要~40亿次运算,远非一般DSP所能。但是产生的图像质量显示了该算法的潜力,也是目前公开发表的图像质量最佳的算法。
结论:Nyquist采样定理告诉我们,只有采样频率大于信号最高频率的2倍,我们才能完全重构出原信号。所以无论采用什么算法,欠采样是无法弥补的。所以出路似乎在于进一步提高像素密度。但是光子的波粒二象性使得光子入射噪音随着像素尺寸的减小而不断增大,而且像素尺寸现在已经接近了光学的衍射极限。
参考文献
[1]D.
Darian Muresan and Thomas W. Parks,"Demosaicing Using Optimal Recovery",
IEEE
TRANSACTIONS ON IMAGE PROCESSING, VOL. 14, NO. 2, FEBRUARY 2005
[2]Ron
Kimmel,"Demosaicing: Image Reconstruction from Color CCD Samples",
IEEE
TRANSACTIONS ON IMAGE PROCESSING, VOL. 8, NO. 9, SEPTEMBER 1999
[3]David
L. Gilblom, "Operation and performance of a color image sensor with layered
photodiodes"
阅读(2367) | 评论(0) | 转发(0) |