数据的冗余性
数据之所以能够压缩是基本原始信源的数据存在着很大的冗余度。一般来说,多媒体数据中存在以下种类的数据冗余:
(1)空间冗余:
同一幅图像常有的冗余。因为规则物体或规则背景的表面物理特征具有相关性。
(2)时间冗余:
序列图像或言语数据常有的冗余。
(3)信息熵冗余:
信息熵:一组数据所携带的信息量。定义为:
H= - |
|
其中:N:数据类数或码元个数;
Pi:码元Yi发生的概率。
(码元:数字信号中每一位的通称。通常又称为"位"或"Bit"。即可以用二进制表示,也可以用其它进制的数表示。)
对于单数据量d: , 其中b(yi)是分配给码元Yi的比特数。
为使d接近于或等于H, 理论上应取:b(yi)=-log2Pi; 但实际中很难估计出{p0, p1, p2, ..., pn-1}, 因此一般取:b(y1)=b(y2)=b(y3)=...=b(yn-1).
这样得到的d必然大于H, 由此带来的冗余我们称之为信息熵冗余或编码冗余。
(4)结构冗余:
有些图像从大的区域上看存在着非常强的纹理结构。
(5)认知冗余:
对有些图像的理解与某些基础知识有相当大的相关性。如人脸图像有固定的结构。这些规律性的结构可由先验知识和背景知识得到。
(6)其他冗余:
如由图像的空间非定长特性所带来的冗余。
数据的压缩
数据压缩就是去掉信号数据的冗余性。又称为数据信源编码或数据编码。
(一)对数字图像进行压缩,通常运用两个基本原理:
(1)数字图像的相关性:在图像的同一行相邻像素之间,活动图像的相邻帧的对应像素之间,往往存在很强的相关性。去除或减少这些相关性,也就是去除或减少图像信息中的冗余度。即实现了对数字图像的压缩。
(2)人的视觉心理特征:人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。
(二)以图像处理为例,对压缩过程做一简要说明:
(1)预准备:数模转换,生成适当的数据表达信息。
(2)处理:即使用复杂算法,进行压缩处理的第一步,如:
从时域到频域的变换:用离散余弦变换;
在活动好视频压缩中:对帧间每个8*8块编码,采用运动矢量编码。
(3)量化:处理上一步产生的结果。该过程定义了从实数到整数的映射方法。这一处理过程导致精度的降低。
(4)熵编码:对序列数据流进行无损压缩。
“处理”和“量化”可在反馈环中交互的重复多次。压缩后的视频构成一数据流,其中,图像起点和压缩技术的标识说明成为数据流的一部分。纠错码也可加在数据流中。
(三)常用图像压缩编码方法:
从信息论角度出发,可分为两大类:
(1)冗余度压缩方法:也称无损压缩,信息保持编码或熵编码。
(2)信息量压缩方法:也称有损压缩,失真度编码或熵压缩编码。
, 从压缩编码算法原理出发,可分为三大类:
(1)无损压缩编码种类:•哈夫曼编码 •算术编码 •行程编码 •Lempel zev编码;
(2)有损压缩编码种类:•预测编码:DPCM,运动补偿 •频率域方法:正文变换编码(如DCT),子带编码 •空间域方法:统计分块编码 •模型方法:分形编码,模型基编码 •基于重要性:滤波,子采样,比特分配,矢量量化;
(3)混合编码:•JBIG,H261,JPEG,MPEG等技术标准。
压缩评价
衡量一个压缩编码方法的重要指标:
(1)压缩比要高;
(2)压缩与解压缩要快,算法实现要简单,硬件实现要容易;
(3)解压缩的图像质量要好。
选用编码方法时一定要考虑图像信源本身的统计特征;多媒体系统(硬件和 软件产品)的适应能力;应用环境以及技术标准。
The End
请参见:
#
阅读(2231) | 评论(0) | 转发(0) |