H.264与MPEG4两种压缩算法的比较-mcuflower-ChinaUnix博客

生命花zhixian.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

mcuflower

博客访问： 2609099
博文数量： 320
博客积分： 9650
博客等级：中将
技术积分： 3886
用户组：普通用户
注册时间： 2009-03-27 21:05

文章分类

全部博文（320）

C#（2）
51单片机（1）
无线技术（14）

Alexa（1）

homekit（2）

蓝牙（6）

WIFI（1）

WIFI（0）

红外（2）
自考（1）
DAC（0）
C语言（8）
USB（3）
STM32（7）
封装（0）
Protel（1）
STM8（2）
VB（3）
加密（1）
串口（2）

RS485（1）
管理学/MBA（2）
股票（48）

缠（2）

陈东（0）
Office 相关（1）
电机（0）
雕刻机（1）

基础知识（1）
ucGUI（1）
算法（2）

数制转换（0）
FPGA/CPLD（54）

视频处理（5）

PCI总线（3）

问题解决（1）

NIOS II（4）

设计规范（2）

ModuleSim（0）

DSP Builder（1）

Matlab（0）

存储器（3）

Verilog（10）

FPGA（0）
Android 手机（2）
手机（3）
生活（24）

成语（1）
Windows（5）
正则表达式（3）
文章（0）
Netbeans（1）
电路（9）

运放（1）

MosFet/IGBT（1）

不同电平互连（1）

自举（2）

PCB布线（2）
数据库（10）

SQL/Oracle（9）
XML（1）
MySQL（4）
Eclipse（4）
Java（70）

Spring（11）

JfreeChart（2）

JSTL（1）

EL表达式（1）

Structs2（2）

CVS（1）

TOMCAT源码分析（2）

日期处理（9）

classloader（8）

Ajax（1）

JavaScript（1）

Servlet & JSP（13）

线程（4）

JDOM（1）

单例（2）

设计模式（1）

Tomcat（1）

控件（1）

注册表操作（4）

串口通讯（3）
PIC单片机相关（1）
ARM开发工具（3）
ARM相关（1）
ARM嵌入式系统（2）
未分配的博文（23）

文章存档

2024年（1）

2017年（5）

2016年（10）

2015年（3）

2014年（3）

2013年（10）

2012年（26）

2011年（67）

2010年（186）

2009年（9）

我的朋友

最近访客

推荐博文

H.264与MPEG4两种压缩算法的比较

分类：

2010-10-30 15:36:59

H.264与MPEG4两种压缩算法的比较作者：文章来源：点击数：更新时间：2009-2-2

JVT（Joint Video Team，视频联合工作组）于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。 JVT的工作目标是制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳，新的视频压缩编码标准称为H.264标准，该标准也被ISO接纳，称为AVC（Advanced Video Coding）标准，是MPEG-4的第10部分。

H.264标准可分为三档：

基本档次（其简单版本，应用面广）；

主要档次（采用了多项提高图像质量和增加压缩比的技术措施，可用于SDTV、HDTV和DVD等）；

扩展档次（可用于各种网络的视频流传输）。

H.264 不仅比H.263和MPEG-4节约了50％的码率，而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制，有利于网络中的分组传输，支持网络中视频的流媒体传输。H.264具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输，从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输，网络亲和性好。

一、H.264视频压缩系统

H.264标准压缩系统由视频编码层（VCL）和网络提取层（Network Abstraction Layer，NAL）两部分组成。VCL中包括VCL编码器与VCL解码器，主要功能是视频数据压缩编码和解码，它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口，它负责对视频数据进行封装打包后使其在网络中传送，它采用统一的数据格式，包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。包头中包含存储标志和类型标志。存储标志用于指示当前数据不属于被参考的帧。类型标志用于指示图像数据的类型。

VCL可以传输按当前的网络情况调整的编码参数。

二、H.264的特点

H.264和H.261、H.263一样，也是采用DCT变换编码加DPCM的差分编码，即混合编码结构。同时，H.264在混合编码的框架下引入了新的编码方式，提高了编码效率，更贴近实际应用。

H.264没有繁琐的选项，而是力求简洁的“回归基本”，它具有比H.263++更好的压缩性能，又具有适应多种信道的能力。

H.264的应用目标广泛，可满足各种不同速率、不同场合的视频应用，具有较好的抗误码和抗丢包的处理能力。

H.264的基本系统无需使用版权，具有开放的性质，能很好地适应IP和无线网络的使用，这对目前因特网传输多媒体信息、移动网中传输宽带信息等都具有重要意义。

尽管H.264编码基本结构与H.261、H.263是类似的，但它在很多环节做了改进，现列举如下。

1．多种更好的运动估计

高精度估计

在H.263中采用了半像素估计，在H.264中则进一步采用1/4像素甚至1/8像素的运动估计。即真正的运动矢量的位移可能是以1/4甚至1/8像素为基本单位的。显然，运动矢量位移的精度越高，则帧间剩余误差越小，传输码率越低，即压缩比越高。

在H.264中采用了6阶FIR滤波器的内插获得1/2像素位置的值。当1/2像素值获得后， 1/4像素值可通过线性内插获得，

对于4:1:1的视频格式，亮度信号的1/4 像素精度对应于色度部分的1/8像素的运动矢量，因此需要对色度信号进行1/8像素的内插运算。

理论上，如果将运动补偿的精度增加一倍（例如从整像素精度提高到1/2像素精度），可有0.5bit/Sample的编码增益，但实际验证发现在运动矢量精度超过1/8像素后，系统基本上就没有明显增益了，因此，在H.264中，只采用了1/4像素精度的运动矢量模式，而不是采用1/8像素的精度。

多宏块划分模式估计

在H.264的预测模式中，一个宏块（MB）可划分成7种不同模式的尺寸，这种多模式的灵活、细微的宏块划分，更切合图像中的实际运动物体的形状，于是，在每个宏块中可包含有1、2、4、8或16个运动矢量。

多参数帧估计

在H.264中，可采用多个参数帧的运动估计，即在编码器的缓存中存有多个刚刚编码好的参数帧，编码器从其中选择一个给出更好的编码效果的作为参数帧，并指出是哪个帧被用于预测，这样就可获得比只用上一个刚编码好的帧作为预测帧的更好的编码效果。

2．小尺寸4?4的整数变换

视频压缩编码中以往的常用单位为8?8块。在H.264中却采用小尺寸的4?4块，由于变换块的尺寸变小了，运动物体的划分就更为精确。这种情况下，图像变换过程中的计算量小了，而且在运动物体边缘的衔接误差也大为减少。

当图像中有较大面积的平滑区域时，为了不产生因小尺寸变换带来的块间灰度差异，H.264可对帧内宏块亮度数据的16个4?4块的DCT系数进行第二次4?4块的变换，对色度数据的4个4?4块的DC系数（每个小块一个，共4个DC系数）进行2?2块的变换。

H.263不仅使图像变换块尺寸变小，而且这个变换是整数操作，而不是实数运算，即编码器和解码器的变换和反变换的精度相同，没有“反变换误差”。

3．更精确的帧内预测

在H.264中，每个4?4块中的每个像素都可用17个最接近先前已编码的像素的不同加权和来进行帧内预测。

4．统一的VLC

H.264中关于熵编码有两种方法。

统一的VLC（即UVLC：Universal VLC）。UVLC使用一个相同的码表进行编码，而解码器很容易识别码字的前缀，UVLC在发生比特错误时能快速获得重同步。

内容自适应二进制算术编码（CABAC：Context Adaptive Binary Arithmetic Coding）。其编码性能比UVLC稍好，但复杂度较高。

三、性能优势

H.264 与MPEG-4、H.263++编码性能对比采用了以下6个测试速率：32kbit/s、10F/s和QCIF；64kbit/s、15F/s和 QCIF；128kbit/s、15F/s和CIF；256kbit/s、15F/s和QCIF；512kbit/s、30F/s和CIF； 1024kbit/s、30F/s和CIF。测试结果标明，H.264具有比MPEG和H.263++更优秀的PSNR性能。

H.264的 PSNR比MPEG-4平均要高2dB，比H.263++平均要高3dB。

四、新的快速运动估值算法

视频编码研究与MPEG标准演进

人类获取的信息中70%来自于视觉，视频信息在多媒体信息中占有重要地位；同时视频数据冗余度最大，经压缩处理后的视频质量高低是决定多媒体服务质量的关键因素。因此数字视频技术是多媒体应用的核心技术，对视频编码的研究已成为信息技术领域的热门话题。

视频编码的研究课题主要有数据压缩比、压缩/解压速度及快速实现算法三方面内容。以压缩/解压后数据与压缩前原始数据是否完全一致作为衡量标准，可将数据压缩划分为无失真压缩（即可逆压缩）和有失真压缩（即不可逆压缩）两类。

传统压缩编码建立在仙农信息论基础之上的，以经典集合论为工具，用概率统计模型来描述信源，其压缩思想基于数据统计，因此只能去除数据冗余，属于低层压缩编码的范畴。

伴随着视频编码相关学科及新兴学科的迅速发展，新一代数据压缩技术不断诞生并日益成熟，其编码思想由基于像素和像素块转变为基于内容（content-based）。它突破了仙农信息论框架的束缚，充分考虑了人眼视觉特性及信源特性，通过去除内容冗余来实现数据压缩，可分为基于对象（object-based）和基于语义（semantics-based）两种，前者属于中层压缩编码，后者属于高层压缩编码。

与此同时，视频编码相关标准的制定也日臻完善。视频编码标准主要由ITU-T和ISO/IEC开发。ITU-T发布的视频标准有H.261、 H.262、 H.263、 H.263+、H.263++，ISO/IEC公布的MPEG系列标准有MPEG-1、MPEG-2 、MPEG-4 和MPEG-7，并且计划公布MPEG-21。

MPEG即Moving Picture Expert Group（运动图像专家组），它是专门从事制定多媒体视音频压缩编码标准的国际组织。MPEG系列标准已成为国际上影响最大的多媒体技术标准，其中 MPEG-1和MPEG-2是采用以仙农信息论为基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术；MPEG-4（ISO/IEC 14496）则是基于第二代压缩编码技术制定的国际标准，它以视听媒体对象为基本单元，采用基于内容的压缩编码，以实现数字视音频、图形合成应用及交互式多媒体的集成。MPEG系列标准对VCD、DVD等视听消费电子及数字电视和高清晰度电视（DTV&&HDTV）、多媒体通信等信息产业的发展产生了巨大而深远的影响。

MPEG-4视频编码核心思想及关键技术

核心思想

在MPEG-4制定之前，MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术，着眼于图像信号的统计特性来设计编码器，属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧，每一帧图像又分成宏块以进行运动补偿和编码，这种编码方案存在以下缺陷：

· 将图像固定地分成相同大小的块，在高压缩比的情况下会出现严重的块效应，即马赛克效应；

· 不能对图像内容进行访问、编辑和回放等*作；

· 未充分利用人类视觉系统（HVS，Human Visual System）的特性。

MPEG-4则代表了基于模型/对象的第二代压缩编码技术，它充分利用了人眼视觉特性，抓住了图像信息传输的本质，从轮廓、纹理思路出发，支持基于视觉内容的交互功能，这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及*作的发展趋势。

AV对象（AVO，Audio Visual Object）是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和*纵的实体，对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。在MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念，而是一个个视听场景（AV场景），这些不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元，其基本单位是原始AV对象，它可以是自然的或合成的声音、图像。原始AV对象具有高效编码、高效存储与传输以及可交互*作的特性，它又可进一步组成复合AV对象。因此MPEG-4标准的基本内容就是对AV对象进行高效编码、组织、存储与传输。AV对象的提出，使多媒体通信具有高度交互及高效编码的能力，AV对象编码就是MPEG-4的核心编码技术。

MPEG-4不仅可提供高压缩率，同时也可实现更好的多媒体内容互动性及全方位的存取性，它采用开放的编码系统，可随时加入新的编码算法模块，同时也可根据不同应用需求现场配置解码器，以支持多种多媒体应用。

MPEG-4 采用了新一代视频编码技术，它在视频编码发展史上第一次把编码对象从图像帧拓展到具有实际意义的任意形状视频对象，从而实现了从基于像素的传统编码向基于对象和内容的现代编码的转变，因而引领着新一代智能图像编码的发展潮流。

关键技术

MPEG-4除采用第一代视频编码的核心技术，如变换编码、运动估计与运动补偿、量化、熵编码外，还提出了一些新的有创见性的关键技术，并在第一代视频编码技术基础上进行了卓有成效的完善和改进。下面重点介绍其中的一些关键技术。

A. 视频对象提取技术

MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来，然后针对不同对象采用相应编码方法，以实现高效压缩。因此视频对象提取即视频对象分割，是MPEG-4视频编码的关键技术，也是新一代视频编码的研究热点和难点。

视频对象分割涉及对视频内容的分析和理解，这与人工智能、图像理解、模式识别和神经网络等学科有密切联系。目前人工智能的发展还不够完善，计算机还不具有观察、识别、理解图像的能力；同时关于计算机视觉的研究也表明要实现正确的图像分割需要在更高层次上对视频内容进行理解。因此，尽管MPEG-4 框架已经制定，但至今仍没有通用的有效方法去根本解决视频对象分割问题，视频对象分割被认为是一个具有挑战性的难题，基于语义的分割则更加困难。

目前进行视频对象分割的一般步骤是：先对原始视频/图像数据进行简化以利于分割，这可通过低通滤波、中值滤波、形态滤波来完成；然后对视频/图像数据进行特征提取，可以是颜色、纹理、运动、帧差、位移帧差乃至语义等特征；再基于某种均匀性标准来确定分割决策，根据所提取特征将视频数据归类；最后是进行相关后处理，以实现滤除噪声及准确提取边界。

在视频分割中基于数学形态理论的分水岭（watershed）算法被广泛使用，它又称水线算法，其基本过程是连续腐蚀二值图像，由图像简化、标记提取、决策、后处理四个阶段构成。分水岭算法具有运算简单、性能优良，能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息，对噪声较敏感，且未利用帧间信息，通常会产生图像过度分割。

B. VOP视频编码技术

视频对象平面（VOP，Video Object Plane）是视频对象（VO）在某一时刻的采样，VOP是MPEG-4视频编码的核心概念。MPEG-4在编码过程中针对不同VO采用不同的编码策略，即对前景VO的压缩编码尽可能保留细节和平滑；对背景VO则采用高压缩率的编码策略，甚至不予传输而在解码端由其他背景拼接而成。这种基于对象的视频编码不仅克服了第一代视频编码中高压缩率编码所产生的方块效应，而且使用户可与场景交互，从而既提高了压缩比，又实现了基于内容的交互，为视频编码提供了广阔的发展空间。

MPEG-4支持任意形状图像与视频的编解码。对于任意形状视频对象。对于极低比特率实时应用，如可视电话、会议电视，MPEG-4则采用VLBV（Very Low Bit-rate Video，极低比特率视频）核进行编码。

传统的矩形图在MPEG-4中被看作是VO的一种特例，这正体现了传统编码与基于内容编码在MPEG-4中的统一。VO概念的引入，更加符合人脑对视觉信息的处理方式，并使视频信号的处理方式从数字化进展到智能化，从而提高了视频信号的交互性和灵活性，使得更广泛的视频应用及更多的内容交互成为可能。因此 VOP视频编码技术被誉为视频信号处理技术从数字化进入智能化的初步探索。

C. 视频编码可分级性技术

随着因特网业务的巨大增长，在速率起伏很大的IP（Internet Protocol）网络及具有不同传输特性的异构网络上进行视频传输的要求和应用越来越多。在这种背景下，视频分级编码的重要性日益突出，其应用非常广泛，且具有很高的理论研究及实际应用价值，因此受到人们的极大关注。

视频编码的可分级性（scalability）是指码率的可调整性，即视频数据只压缩一次，却能以多个帧率、空间分辨率或视频质量进行解码，从而可支持多种类型用户的各种不同应用要求。

MPEG-4通过视频对象层（VOL，Video Object Layer）数据结构来实现分级编码。MPEG-4提供了两种基本分级工具，即时域分级（Temporal Scalability）和空域分级（Spatial Scalability），此外还支持时域和空域的混合分级。每一种分级编码都至少有两层VOL，低层称为基本层，高层称为增强层。基本层提供了视频序列的基本信息，增强层提供了视频序列更高的分辨率和细节。

在随后增补的视频流应用框架中，MPEG-4提出了FGS（Fine Granularity Scalable，精细可伸缩性）视频编码算法以及PFGS（Progressive Fine Granularity Scalable，渐进精细可伸缩性）视频编码算法。

FGS编码实现简单，可在编码速率、显示分辨率、内容、解码复杂度等方面提供灵活的自适应和可扩展性，且具有很强的带宽自适应能力和抗误码性能。但还存在编码效率低于非可扩展编码及接收端视频质量非最优两个不足。

PFGS则是为改善FGS编码效率而提出的视频编码算法，其基本思想是在增强层图像编码时使用前一帧重建的某个增强层图像为参考进行运动补偿，以使运动补偿更加有效，从而提高编码效率。

D. 运动估计与运动补偿技术

MPEG-4采用I-VOP、P-VOP、B-VOP三种帧格式来表征不同的运动补偿类型。它采用了H.263中的半像素搜索（half pixel searching）技术和重叠运动补偿（overlapped motion compensation)技术，同时又引入重复填充（repetitive padding）技术和修改的块（多边形）匹配（modified block （polygon）matching）技术以支持任意形状的VOP区域。

此外，为提高运动估计算法精度，MPEG-4采用了MVFAST（Motion Vector Field Adaptive Search Technique）和改进的PMVFAST（Predictive MVFAST）方法用于运动估计。对于全局运动估计，则采用了基于特征的快速顽健的FFRGMET（Feature-based Fast and Robust Global Motion Estimation Technique）方法。

新的快速运动估值算法UMHexagonS（中国专利）是一种运算量相对于H.264中原有的快速全搜索算法可节约 90％以上的新算法，全名叫“非对称十字型多层次六边形格点搜索算法”（Unsymmetrical-Cross Muti-Hexagon Search）”，这是一种整像素运动估值算法。由于它在高码率大运动图像序列编码时，在保持较好率失真性能的条件下，运算量十分低，已被H.264标准正式采纳。

ITU和 ISO合作发展的 H.264（MPEG-4 Part 10）有可能被广播、通信和存储媒体（CD DVD）接受成为统一的标准，最有可能成为宽带交互新媒体的标准。我国的信源编码标准尚未制定，密切关注H.264的发展，制定我国的信源编码标准的工作正在加紧进行。

H264标准使运动图像压缩技术上升到了一个更高的阶段，在较低带宽上提供高质量的图像传输是H.264的应用亮点。H.264的推广应用对视频终端、网守、网关、MCU等系统的要求较高，将有力地推动视频会议软、硬件设备在各个方面的不断完善。

MPEG4视频压缩编码技术详解

MPEG 全称是Moving Pictures Experts Group，它是“动态图象专家组”的英文缩写，该专家组成立于1988年，致力于运动图像及其伴音的压缩编码标准化工作，原先他们打算开发MPEG1、 MPEG2、MPEG3和MPEG4四个版本，以适用于不同带宽和数字影像质量的要求。

目前，MPEG1技术被广泛的应用于VCD，而MPEG2 标准则用于广播电视和DVD等。MPEG3最初是为HDTV开发的编码和压缩标准，但由于MPEG2的出色性能表现， MPEG3只能是死于襁褓了。而我们今天要谈论的主角——MPEG4于1999年初正式成为国际标准。它是一个适用于低传输速率应用的方案。与MPEG1 和MPEG2相比，MPEG4更加注重多媒体系统的交互性和灵活性。下面就让我们一起进入多彩的MPEG4世界。

MPEG4的技术特点

MPEG1、MPEG2技术当初制定时，它们定位的标准均为高层媒体表示与结构，但随着计算机软件及网络技术的快速发展，MPEG1.MPEG2技术的弊端就显示出来了：交互性及灵活性较低，压缩的多媒体文件体积过于庞大，难以实现网络的实时传播。而MPEG4技术的标准是对运动图像中的内容进行编码，其具体的编码对象就是图像中的音频和视频，术语称为“AV对象”，而连续的AV对象组合在一起又可以形成AV场景。因此，MPEG4标准就是围绕着AV对象的编码、存储、传输和组合而制定的，高效率地编码、组织、存储、传输AV对象是MPEG4标准的基本内容。

在视频编码方面，MPEG4支持对自然和合成的视觉对象的编码。（合成的视觉对象包括2D、3D动画和人面部表情动画等）。在音频编码上，MPEG4可以在一组编码工具支持下，对语音、音乐等自然声音对象和具有回响、空间方位感的合成声音对象进行音频编码。

由于MPEG4只处理图像帧与帧之间有差异的元素，而舍弃相同的元素，因此大大减少了合成多媒体文件的体积。应用MPEG4技术的影音文件最显著特点就是压缩率高且成像清晰，一般来说，一小时的影像可以被压缩为350M左右的数据，而一部高清晰度的DVD电影, 可以压缩成两张甚至一张650M CD光碟来存储。对广大的“平民”计算机用户来说，这就意味着, 您不需要购置 DVD-ROM就可以欣赏近似DVD质量的高品质影像。而且采用MPEG4编码技术的影片，对机器硬件配置的要求非常之低，300MHZ 以上CPU，64M的内存和一个 8M显存的显卡就可以流畅的播放。在播放软件方面，它要求也非常宽松，你只需要安装一个 500K左右的 MPEG4 编码驱动后，用 WINDOWS 自带的媒体播放器就可以流畅的播放了（下面我们会具体讲到）。

在MPEG-4视频编码中，运动估计相当耗时，对编码的实时性影响很大。因此这里特别强调快速算法。运动估计方法主要有像素递归法和块匹配法两大类，前者复杂度很高，实际中应用较少，后者则在H.263和MPEG中广泛采用。在块匹配法中，重点研究块匹配准则及搜索方法。目前有三种常用的匹配准则：

（1）绝对误差和（SAD, Sum of Absolute Difference）准则；

（2）均方误差（MSE, Mean Square Error）准则；

（3）归一化互相关函数（NCCF, Normalized Cross Correlation Function）准则。

在上述三种准则中，SAD准则具有不需乘法运算、实现简单方便的优点而使用最多，但应清楚匹配准则的选用对匹配结果影响不大。

在选取匹配准则后就应进行寻找最优匹配点的搜索工作。最简单、最可靠的方法是全搜索法（FS, Full Search），但计算量太大，不便于实时实现。因此快速搜索法应运而生，主要有交叉搜索法、二维对数法和钻石搜索法，其中钻石搜索法被MPEG-4校验模型（VM, Verification Model）所采纳，下面详细介绍。

钻石搜索（DS, Diamond Search）法以搜索模板形状而得名，具有简单、鲁棒、高效的特点，是现有性能最优的快速搜索算法之一。其基本思想是利用搜索模板的形状和大小对运动估计算法速度及精度产生重要影响的特性。在搜索最优匹配点时，选择小的搜索模板可能会陷入局部最优，选择大的搜索模板则可能无法找到最优点。因此DS算法针对视频图像中运动矢量的基本规律，选用了两种形状大小的搜索模板。

· 大钻石搜索模板（LDSP, Large Diamond Search Pattern），包含9个候选位置；

· 小钻石搜索模板（SDSP, Small Diamond Search Pattern），包含5个候选位置。

DS算法搜索过程如下：开始阶段先重复使用大钻石搜索模板，直到最佳匹配块落在大钻石中心。由于LDSP步长大，因而搜索范围广，可实现粗定位，使搜索不会陷于局部最小，当粗定位结束后，可认为最优点就在LDSP 周围8 个点所围菱形区域中。然后再使用小钻石搜索模板来实现最佳匹配块的准确定位，以不产生较大起伏，从而提高运动估计精度。

此外Sprite视频编码技术也在MPEG-4中应用广泛，作为其核心技术之一。Sprite又称镶嵌图或背景全景图，是指一个视频对象在视频序列中所有出现部分经拼接而成的一幅图像。利用Sprite可以直接重构该视频对象或对其进行预测补偿编码。

Sprite视频编码可视为一种更为先进的运动估计和补偿技术，它能够克服基于固定分块的传统运动估计和补偿技术的不足，MPEG-4正是采用了将传统分块编码技术与Sprite编码技术相结合的策略。

MPEG4的应用领域

凭借着出色的性能，MPEG4技术目前在多媒体传输、多媒体存储等领域得到了广泛的应用，下面我们就来看看目前在那些领域MPEG4技术得到了大显伸手的机会。

1、精彩的视频世界

精彩的视频世界是MPEG4技术应用最多也是最为广大朋友所熟悉的的形式。目前它主要以两种形式出现，一种是DIVX－MPEG4影碟（国内市面上已出现，且D版居多），另一种是网上MPEG4电影。

（1）、我们先来说说DIVX－MPEG4影碟，DIVX视频编码技术实际上就是MPEG4压缩技术，它由微软MPEG4V3修改而来，使用的是MPEG4压缩算法，并同时分离视频和音频。它的核心部分便是由DivX对DVD音视频进行压缩，生成Mpeg4视频格式文件(也就是AVI格式)。

小提示：笔者也是经常被朋友所问到：“我看到的MPEG4电影片段明明是avi（扩展名）格式文件，并且Windows的媒体播放器也与之关联，但就是无法播放”。其实， MPEG4并没有确定必须用什么扩展名，它只是一种编码方法而已。使用avi作为扩展名，是一种习惯性的沿用。

在计算机上播放MPEG4影音文件的方法目前有两种：第一种是用诸如DivxPlayer等专门的播放软件来播放；第二种播放方法是安装MPEG4(Divx)插件后，用Windows自带的媒体播放机来播放。

（2）、随着网络技术的不断发展，互联网上的视频流应用也成为了近几年的热门话题。目前，在互联网上比较流行的几种影像格式包括Quicktime、 RealPlay以及微软的MediaPlayer等。MPEG4技术出现之后，互联网上又出现了MPEG4格式的电影，不过在观看前，系统会提示你下载最新的MPEG4解码软件。

小提示：大家平时在网上可能经常会看见ASF格式的电影，其实它也是微软公司开发出的一种可以直接在网上观看视频节目的压缩格式。使用的也是MPEG4的压缩算法，但因为它是以网上即时观看电影的视频流格式存在的，所以它的图像质量相对要差一些。

2、低比特率下的多媒体通信，

目前，MPEG4技术已经广泛的应用在如视频电话、视频电子邮件、移动通信、电子新闻等多媒体通信领域。由于这些应用对传输速率要求较低，一般在 4.8～64kbit/s之间，分辨率为176×144左右。因此MPEG4技术完全可以充分的利用网络带宽，通过帧重建技术压缩和传输数据，以最少的数据量获得最佳的图像质量。

3、实时多媒体监控。

多媒体监控领域原来一直是MPEG1技术担当重任，但近些年来，它们也是“城头变换大王旗”了。由于MPEG4压缩技术原本是一种适用在低带宽下进行信息交换的音视频处理技术，它的特点是可以动态的侦测图像各个区域变化，基于对象的调整压缩方法可以获得比MPEG1更大的压缩比，使压缩码流更低。因此，尽管MPEG4技术一开始并不是专为视频监控压缩领域而开发的，但它高清晰度的视频压缩，在实时多媒体监控上，无能是存储量，传输的速率，清晰度都比MPEG1具有更大的优势。

阅读(2077) | 评论(1) | 转发(1) |

上一篇：H.264与其他视频压缩算法的比较

下一篇：最热FPGA/CPLD论坛推荐！！！

给主人留下些什么吧！~~

chinaunix网友2010-10-31 19:11:56

很好的, 收藏了推荐一个博客，提供很多免费软件编程电子书下载： http://free-ebooks.appspot.com

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6