MPEG-IV的标准和应用(转)-zhubingke-ChinaUnix博客

努力工作,快乐生活!zhubingke.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhubingke

博客访问： 985148
博文数量： 108
博客积分： 3243
博客等级：中校
技术积分： 964
用户组：普通用户
注册时间： 2008-06-15 22:09

文章分类

全部博文（108）

linux（6）
OpenGL（20）
液晶屏（0）
FFMpeg（13）
计算机科学（9）
Qt编程（15）
C/C++编程（12）
Delphi编程（27）
音视频处理（6）
未分配的博文（0）

文章存档

2020年（2）

2019年（1）

2018年（2）

2017年（9）

2016年（20）

2015年（1）

2013年（1）

2012年（12）

2011年（28）

2010年（27）

2009年（4）

2008年（1）

我的朋友

最近访客

推荐博文

MPEG-IV的标准和应用(转)

分类： IT业界

2012-01-12 16:40:10

来自:

MPEG-IV的标准和应用一、MPEG是什么？ MPEG是运动图像专家组的简称，全称是ISO/IEC JTC1/SC29/WG11，即国际标准化组织和国际电工委员会第一联合技术组第29分委会第11工作组，负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作，制定的标准推动了VCD、DVD、数字电视、高清晰度数字电视等产品的发展。 JPEG是联合图像专家组的简称，全称是ISO/IEC JTC1/SC29/WG1，即国际标准化组织和国际电工委员会第一联合技术组第29分委会第1工作组，负责静止图像编码国际标准的制定，所制定的JPEG、JBIG、JPEG2000等标准在传真机、数字相机等产品中得到了广泛应用。

二、MPEG制定的标准

MPEG-1和MPEG-2是MPEG组织制定的第一代视、音频压缩标准，为VCD、DVD及数字电视和高清晰度电视等产业的飞速发展打下了牢固的基础，曾获得了著名的Emmy奖。MPEG-4是基于第二代视音频编码技术制定的压缩标准，以视听媒体对象为基本单元，实现数字视音频和图形合成应用、交互式多媒体的集成，目前已经在流式媒体服务等领域开始得到应用。MPEG-7是多媒体内容描述标准，支持对多媒体资源的组织管理、搜索、过滤、检索，已基本完成。正在制定的MPEG-21的重点是建立统一的多媒体框架，为从多媒体内容发布到消费所涉及的所有标准提供基础体系，支持连接全球网络的各种设备透明地访问各种多媒体资源。

目前，MPEG系列国际标准已经成为影响最大的多媒体技术标准，对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。

三、MPEG4的特点

MPEG（Moving Picture Experts Group）专家组继成功定义了MPEG—1和MPEG—2之后，于1993年7月开始制订全新的MPEG－4标准，并分别于1999年初和2000年初正式公布了版本1和版本2。到2001年10月，MPEG一4已定义了19个视像类（Visual Profile），其中新定义的简单演播室类（Simple Studio Profile）和核心演播室类（Core studio Profile）使MPEG-4对MPEG-2类别保留了一些形式上的兼容，其码率可高达2Gbps。随着MPEG-4标准的不断扩展，它不但能支持码率低于64kbps的多媒体通信，也能支持广播级的视频应用。MPEG-4标准将广泛运用于数字电视、动态图像、万维网（www）、实时多媒体监控、基于内容存储和检索的多媒体系统、互联网上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等，它将推动电信、计算机、广播电视三大网络的最终融合，从而成为今后一段时间压缩标准的主流。

1、 MPEG-4 标准的主要特点和功能

MPEG—4视频编码标准支持MPEG—1、MPEC－2中的大多数功能，提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码，同时也支持基于内容的图像编码。图1为MPEG一4支持的码率与相应功能集之间关系的示意图。

在这一功能集的底层是VLBV（Very Low Bit Rate Video）核心。它为码率在5一64kbps范围内的视频操作与应用提供算法与工具，支持较低的空间分辨率（低于352 X 288像素）和较低的帧频（低于15Hz）。VLBV核心支持的专用功能包括：矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。

MPEG—4的HBV（High Bit Rate Video）同样支持上述功能，其码率范围在64kbps—10Mbbps之间，它与VLBL核心采用相同或相似的算法，但它支持更高的空间与时间分辨率，允许传输和存储适用于演播室的高质量视频信号，其输入可以是ITU-R Rec.601的标准信号，典型应用为数字电视广播与交互式检索。MPEG－4最终支持的码率将高于MPEG—2。　　MPEG－4 提出了基于内容（Content－based）的存取概念，使用户可与场景进行交互。它对运动图像中的内容进行编码，其具体的编码对象就是图像中的音频和视频，称为AV对象（AVO：Audio Video Object）。AV对象可以组成AV场景（AVOs：Audio Video Object in a scene）。因此，MPEG—4标准的基本内容就是高效率地编码、组织、存储、传输AV对象。MPFG－4标准支持8项新的或改进的功能，可分为以下3类：

1)      基于内容的交互性

基于内容的多媒体数据存取工具；基于内容的码流操纵和编辑；自然与合成数据的混合编码；增强的时间域随机存取。

2)      高压缩率

提高编码效率；对多个并发数据流的编码。

3)      灵活多样的存取

错误易发环境中的抗错性（Robustness）；基于内容的尺度可变性（Content-based scalability）。

2、MPEG-4标准的构成
1）DMIF

DMIF即多媒体传送整体框架，它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过DMIF，MPEG-4可以建立具有特殊品质服务（QoS：Quality of Service）的信道和面向每个基本流的带宽。

2）数据平面

MPEG-4中的数据平面可以分为两部分：传输关系部分和媒体关系部分。为了使基本流和AV对象在同一场景中出现，MPEG-4引用了对象描述（OD）和流图桌面（SMT）的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT（Channel Association Tag）相连，CAT可实现该流的顺利传输。

3）缓冲区管理和实时识别

MPEG-4定义了一个系统解码模式（SDM），该解码模式描述了一种理想的处理比特流句法语义的解码装置，它要求特殊的缓冲区和实时模式。通过有效的管理，可以更好地利用有限的缓冲区空间。

4）音频编码

MPEG-4的优越之处在于，它不仅支持自然声音，而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合，并支持音频的对象特征。

5）视频编码

与音频编码类似，MPBG—4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。

6）场景描述

MPEG—4提供了一系列工具，用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述。

3、MPEG-4 标准的视频编码技术

为了支持基于内容的交互性，即支持对内容独立地进行编、解码，MPEG一4视频检验模型引入了视频对象面（VOP：Video Object Plane）的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域（视频对象面），每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的，且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输，或者编码为一个隔离的视频对象层（VOL：Video Object Layer）。

MPEG－4视频编码器的基本结构包括形状编码（对于任意形状的VOS）、运动补偿和基于DCT的纹理编码（采用标准的 8 X 8 DCT或根据形状的自适应DCT）。具体的编码方法为：首先对输入的原图像序列进行场景分析和对象分割，以划分不同的VOP，得到各个VOP的形状和位置信息，它可以用alpha平面来表示。发送端只需传送alðha平面，接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多，需要进行压缩编码。显然，只要对VOP的轮廓进行编码和传送，接收端就可以恢复alpha平面，轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似MPEG-1／2标准的运动预测／补偿法。输入第N帧的VOP与帧存储器中存储的N—1帧的VOP进行比较，找到运动矢量，然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛，以提高编码效率。编码后得到的纹理信息，与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码，形成各自的比特流层，经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

虽然MPEG－4标准体系完整广泛，但此标准之部分相关技术尚处开发阶段。

四、MPEG4的应用

MPEG4的应用前景将是非常广阔的。它的出现将对以下各方面产生较大的推动作用：数字电视、动态图象、万维网（WWW）、实时多媒体监控、低比特率下的移动多媒体通信、内容存储和检索多媒系统、Internet/Intranet上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等。

基于MPEG4标准的解决方案纷纷推出，有的为硬件方案，有的为软件方案。前者为设计一个MPEG-4专属解码芯片，但由于部分MPEG－4相关技术（如：串流格式），尚处百家争鸣时期，主流尚未浮现，这使得芯片厂商仅能择一而为之。再由成本角度来看，因为多加了解码芯片，系统成本也随之提高。后者软件方案则用既有的系统CPU来进行解码。此法较具有弹性，可随时依市场需求态势改版更新，又因省去了解码芯片而降低系统成本。

目前已经开发好的基于MPEG4标准的方案有：视频会议、远程监控、交互教学、远程医疗、视频通讯，等等。

五、结束语

MPEG－4标准可用“博大精深”四个字来形容。其涵盖领域之广大，已超越了单纯视音频编解码范畴，成为以对象内容为主体的多媒体展示架构。

对多媒体内容创作业者而言，MPEG－4使多媒体内容更多元化、更具有弹性、多媒体组件能更容易被再利用。它将现今各自发展的技术及应用，如互联网、动画、视频、音频、互动电视等整合至单一架构之下，而且提供更佳的资源管理方法和保护著作权的机能。

对网络服务业者而言，MPEG－4是透明度很高的信息传递工具。它可以藉由与其它国际标准的兼容相通而存在于各种形式网络上，如有线电视网络、电信网络以及无线传输等。尤其在单纯以视频音频传输为主的应用中，相较于MPEG－l或MPEG－2，MPEG－4仅需较小的比特率，即可达成相同音画质效果，如此即意味着较高的频宽使用效率。

对终端消费者而言，MPEG－4能让消费者在原创作者限定的操作功能范围之内，与节目内容中的对象互动，体会前所未有的娱乐效果。而且在移动式低传输速率网络中，促使多媒体应用得以实现。这包括了交互式多媒体广播和移动通讯。

因应市场的需求，我们将会看到更多、更灵活的MPEG－4应用。比如手机、机顶盒、电视的互动，有线、无线多媒体内容的传送，节目制作与增值服务业的串联等等，都将会是MPEG－4的贡献。

阅读(1498) | 评论(0) | 转发(0) |

上一篇：音频波形绘制方法

下一篇：InterLockedIncrement 和 InterLockedDecrement(Inc 与 Dec)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6