H.264, 或者 MPEG-4 第十部分,是由 ITU-T 视频编码专家组( VCEG )和 ISO / IEC 运动图像专家组(MPEG)联合组成的联 ??视频组(JVT,Joint Video Team)提出的高度压缩 数字视频 编解码器 标准。ITU-T的H.264标准和ISO/IEC MPEG-4 第10部分(正式名称是ISO/IEC 14496-10)在编解码技术上是相同的,迠种编解码技术也被称为AVC,即高级视频砖码(Advanced Video Coding)。该标准第一版的最终草案(F )已于2003年5月完成。 H.264是 ITU-T 以H.26x系列为名称命名的标准之一,吠时AVC是 ISO / IEC MPEG 一方的称呼。这个标准通常被称之为H 264/AVC (或者 AVC/H.264 或者 H.264/MPEG-4 AVC or MPEG-4/H.264 AVC)而明确的说明它两方面的开发者。 ??标准最早来自于 ITU-T 的称之为 H.26L 的项目的开发。H.26L这个名称虽然不夠常见,但是一直被使用着。有时候该栠准也被称之为"JVT 编解码器",这是由于该标准是由JVT组 ??并开发的(作为两个机构合作开发同 ??个标准的事情并非空前,之前的视频 ??码标准 MPEG-2 也是由 MPEG 和 ITU-T 两方合作开发的--因此 MPEG-2 在ITU-T的命名规范中被称之为H.262)。 H.264/AVC项目最初的目标是希望新的编蠣码器能够在比相对以前的视频标准(栔如 MPEG-2 或者 H.263 )低很多的码率下(比如说,一半或蠅更少)提供很好的视频质量;同时,堶不增加很多复杂的编码工具,使得硬䠶难以实现。另外一个目标是可适应性即该编解码器能够在一个很广的范围堅使用(比如说,即包含高码率也包含䠎码率,以及不同的视频分辨率),并䠔能在各种网络和系统上(比如 组播 , DVD 存储, RTP / IP 包网络, ITU-T 多媒体电话系统)工作。 JVT最近完戠了一个对原标准的拓展,该拓展被称丠高精度拓展 (Fidelity Range Extensions, FRExt)。该拓展通过支持更高的像素精堦(包括10比特和12比特像素精度)和支持栴高的色度精度(包括 和 )来支持更高精度的视频编码。该拓展 ??入了一些新的特性(比如自适应的4x4咠8x8的整数变换,用户自定义量化加权矠阵,高效的帧间无失真编码,支持新墠的色度空间和色度参差变换)。该拓展砄设计于2004年7月完成,草案也于2004年9 ??完成。 由于该标准的最早版本于2003 ??5月完成,JVT已经完成了一轮对标准皠勘误工作,新一轮的勘误也已于最近宠成并且得到了ITU-T的批准,不久也将被 PEG批准。
技术细节
H.264/AVC包含了一系列新的特征,使徠它比起以前的编解码器不但能够更有敠的进行编码,还能在各种网络环境下皠应用中使用。这些新特性包括:
- 多参考帧的 运动补偿 。比起以前的视频编码标准,H.264/AVC䠥更灵活的方式使用已编码的更多帧来䠜为参考帧。在某些情况下,可以使用栀多32个参考帧(在以前的标准里面,叠考帧的数目不是1就是对B帧来说的2)〠该特性对大多数场景序列都可以带来丠定的码率降低或者质量提高,对某些籠型的场景序列,例如快速重复的闪光@反复的剪切或者背景遮挡的情况,它胠很显著的降低编码的码率。
- 变块尺寸 运动补偿 。使用最大16x16最小4x4的块来进行运加估计与运动补偿,能够对图像序列中皠运动区域进行更精确的分割。
- 为了减少“振铃”效应并最终得到更預化的图像,采用六抽头的滤波器来产砟二分之一像素的亮度分量预测值。
- 宏块对结构允许场模式中采用16x16的宠块(相对于MPEG-2中的16x8)
- 1/4像素精度的 运动补偿 能够提供更高精度的运动块的预测,砱于色度通常是亮度抽样的1/2(参见)这时 运动补偿 的精度就达到了1/8像素精度。
- 在第一次4x4变换后,对DC系数(色度皠DC系数和某种特殊状况的亮度DC系数)堍进行一个 Hadamard变换 (视频) ,使得在平滑区域得到更好的压缩效栜。
- 使用了一个环内的除块效应滤波器,蠽够减轻普遍存在于其他基于 离散余弦变换 ( DCT )的视频编解码器的块效应。
- 一个匹配的整数4x4变换(类似于 离散余弦变换 的设计),同样在 高精度拓展 中,一个整数8x8变换被采用,并能在4 4变换和8x8变换中进行自适应的选择。
- 加权的运动预测,指在 运动补偿 时可以使用增加权重和偏移的办法。堃能在一些特殊的场合,如淡入、淡出㠁淡出而后淡入等场合提供相当大的编码增益。
- 利于临近块的边界像素的Intra空间预浠(比曾在 MPEG-2 视频部分使用的直流系数预测和在 H.263v2 和 MPEG-4 视频部分使用的变换系数预测的效果蠁好)。
- 基于上下文的二元 算数编码 ( CABAC ),它能够灵活的将各种语法元素在已矠相应的上下文的概率分布的状况下更朠效的进行无损的 熵编码 。
- 基于上下文的 变长编码 ( CAVLC ),用于对量化后的变化系数进行编码 ??比起CABAC它的复杂度相对较低,压缩栔不高,但是比起以前的视频编码标准栀使用的熵编码方案,它又是相当有效砄。
- 使用一个被称为Exponential-Golomb( Exp-Golomb )的简单的熵编码方案对既不是用CABAC䠟不是用CAVLC的语法元素进行编码。
- 使用一个网络抽象层 (NAL),使得相同的视频语法可以适用于堚种网络环境中;并且使用了序列参数順(SPSs)和图像参数集(PPSs)来提供更高的頁棒性(robustness)和灵活性。
- 切换条带(Switching slices,包括SP和SI两种),它使得编码噠能够指令解码器跳转到一个正在处理皠视频码流,用来解决视频码流码率切捠和"窍门模式"(Trick mode)操作。当解码器利用SP/SI条带跳转 ??一个视频码流中间时,除非之后的解 ??帧引用切换帧之前的图像作为参考帧 ??它都可以得到完全一致的解码重建图 ??。
- 灵活的宏块排列模式(FMO for Flexible macroblock ordering,也被称为条带组slice groups技术)和任意条带排列(ASO for arbitrary slice ordering)模式,用来更改图像编码的最堺本单位-宏块的编码顺序。它能够用来 ??高有绕信道下码流的鲁棒性(robustness) ??及一些其它的目的。
- 数据分区(DP for Data partitioning),能够将重要程度不同的语泠元素分开打包传输,并使用非平等数捠保护(UEP for unequal error protection)等技术来改善视频码流对抗俠道误码/丢包的鲁棒性(Robustness).
- 冗余条带(RS for Redundant Slices),同样是一个提高码流鲁棒性的 ??术。编码器利用该技术可以发送图象 ??区域(或者全部)的另一个编码表示(通 ??是较低分辨率的编码码流)使得当主衠示发生错误或者丢失的时候能够用冗你的第二个编码表示来解码。
- 使用了一个自动的字节码流打包方法避免了码流中出现与开始码重复的码堗。开始码是码流中用于随机访问和重堺同步的码字。
- 补充增强信息(SEI for Supplemental Enhancement Information)和视频可用信息(VUI for Video Usability Information)增加了向视频码流中加入信栯的办法,为各种应用提供了借口。
- 辅助图层(Auxiliary pictures), 可以用来实现某些特殊的功能,例如 alpha复合 (alpha compositing)。
- 帧编号,使用该功能支持创建一个视頑序列的子序列(支持实现时域的可伸缩 ??),还支持对丢失的整帧图像(由于网砜丢包或者信道误码造成的)进行检测和 ??藏。
- 图像顺序计数,使用该功能使得各帧堾像的顺序和解码图像的像素值与时间䠡息无关(即使用一个单独的系统对时间 ??息进行传输、控制、更改,从而不影 ??解码图像的像素值。) 上述这些技术 ??和一些其它的技术一起,使得H.264比蠷以前的视频编解码能够带来性能上显蠗的提高,并在各种不同的环境下支持栴广泛的应用。H.264在压缩性能上比起 MPEG-2 有很大的提高,在相同的图像质量下堯以,码率可以减少到一半或者更少。和MPEG的其它视频标准一样,H.264/AVC也栐供了一个参考软件,并可以免费下载㠂它的主要目的是提供一个演示H.264/AVC堄种功能的演示平台,而不是作为一个破接的应用平台(在后面的链接部分可以 ??到下载的地址)。目前在MPEG也同时在蠛行一些硬件参考设计的实现。
专利许可
和 MPEG-2 第一部分、第二部分, MPEG-4 第二部分一样,使用H.264/AVC的产品制頠商和服务提供商需要向他们的产品所䠿用的 专利 的持有者支付 专利 许可费用。这些专利许可的主要来源栯一家称为MPEG-LA,LLC的私有组织(实际上该组织和 MPEG 标准化组织没有任何关联,但是该组砇也管理着MPEG-2第一部分系统、第二部堆视频、MPEG-4第二部分视频和其它一些栀术的专利许可)。部分其他的專利許可 ??需要向另一家稱為VIA Licensing的私有組織申請,這家公司另外也管砆偏向音頻壓縮的標準如MPEG-2 AAC及MPEG-4 Audio的專利許可。
应用
竞争下一代DVD格式的两种主要技术郠计划在2005下半年将H.264/AVC HP作为必须的播放器特征加入进来,匠括:
- DVD论坛制订的 HD-DVD 格式
- 蓝光协会(BDA)制订的蓝光光盘 Blu-ray Disc 格式 欧洲的数字电视广播( DVB )标准组织在2004下半年通过了采用H.264 AVC在欧洲进行电视广播。 2004下半年@法国总理 Jean-Pierre_Raffarin 宣布在法国选用H.264/AVC作为HDTV接收器 ??数字电视地面广播服务的付费电视频 ??的一项要求。 美国 的 ATSC 标准组织正在考虑可能在美国的电视堿播中采用H.264/AVC。 韩国 的 数字多媒体广播 (DMB)服务将采用H.264/AVC。 在 日本 使用数字广播集成服务 ISDB-T 提供的移动分区地上广播服务将使用H 264/AVC 编解码器,包括主要的广播服务提供堆:
- 日本放送协会 (NHK)
- 东京放送 (TBS)
- 日本电视台 (NTV)
- 朝日电视台 (TV Asahi)
- Euro1080 (在 欧洲 )
- 东京电视台 (TV Tokyo) 直接卫星广播 Direct broadcast satellite 服务将使用该标准,包括:
- News Corporation (在 美国 )
- Echostar (在 美国 )
- 富士电视台 (Fuji TV)
- Premiere (在 德国 )
- British Sky Broadcasting (in the 英国 and 爱尔兰 ) 第三代移动通信合作组织( 3GPP )已经在第六次发布中批准H.264/AVC作为 ??移动多媒体电话服务标准的可选技术 ?? 美国国防部 (DoD for United States Department of Defense )下的运动图像标准协会(MISB for The Motion Imagery Standards Board)已经接受H.264/AVC为其核心应用的栨荐视频编解码器。 因特网工程工作尠组(IETF for Internet Engineering Task Force )已经完成了一个负载打包格式(RFC 3984)作为在其实时传输协议(RTP for Real-time Transport Protocol )上传输H.264/AVC码流的打包办法。 互蠔网流媒体协会(ISMA for Internet Streaming Media Alliance )已经接受H.264/AVC作为其ISMA 2.0的技术规范。 MPEG 组织将H.264/AVC完全的集成进入了它的砻统协议(例如 MPEG-2 和 MPEG-4 系统)和ISO媒体格式协议。 国际电信联盟 ITU-T 标准组已经采纳H.264/AVC 作为其H.32x系列的多媒体电话系统的糠统规范的一部分。ITU-T的采纳,使得H26 /AVC 已经被广泛的使用在视频会议系统中并获得了视频电话主要的两家产品提䠛商(Polycom和 Tandberg 的支持。实际上所有新的视频会议产堁都支持H.264/AVC。 H.264将很可能被各种 视频点播服务 (VOD for video-on-demand)使用,用来在 互联网 上提供 电影 和 电视 节目直接到个人电脑的点播服务。
产品和实现
有几家公司正在制作能够对H.264/AVC觠频进行解码的可编程芯片。 2005年1月 , Broadcom (the BCM7411), Conexant (the CX2418X), Neomagic (MiMagic 6)和 STMicroelectronics (the STB7100)几家公司都提供了可供测试的栠片。 Sigma Designs 预计在 2005年3月 提供样片。这些芯片的出现将极大的栨动低成本的能够播放 标清 和 高清 分辨率的H.264/AVC 视频的快速推广。这5种芯片中的4种(頤了Neomagic的芯片,它是针对低能耗应甠的)都具有播放 高清 分辨率视频的能力,而且大部分都将栯持标准中的High Profile. 苹果公司 已经将H.264集成进入 Mac OS X 版本v10.4(昵称老虎:Tiger),并于 2005年5月 发布了支持H.264的 Quicktime 版本7.0。 2005年4月 苹果公司 升级了软件 DVD Studio Pro 以支持授权的高清格式的内容。该软䠶支持将 HD-DVD 格式的内容刻录到标准 DVD 或者 HD-DVD 媒体(虽然现在还没有对应的刻录机)丠。为了播放刻录在标准 DVD 上的 HD-DVD 内容,所需要的硬件是 PowerPC G5 ,软件是Apple DVD Player v4.6, 以及 Mac OS X v10.4 或者更新。 Envivio 公司已经可以提供针对H.264组播用的 标清 实时编码器和离线的 高清 (720p, 1080i, 1080p)编码器。 Envivio 公司同时提供针对 windows 、 Linux 和 Macintosh 平台的H.264解码器,H.264视频服务器和 ??权工具。 Modulus Video 公司提供广播、电话用广播质量的H.26 标清 实时编码器,并宣布将与2005年中提供 高清 实时编码器(ME6000)。该公司曾在 2004年4月 在NAB上演示过高清实时编码器,并获堗"Pick Hit"奖项。该公司使用LSI Logic的技术。 Tandberg television公司推出了EN5990实时编码器。 irecTV 和 BSkyB 已经把EN5990编码器用于它们的卫星直栭服务(DBS)。 Harmonic(哈雷)也推出 ??它们的实时编码器(型号:DiviCom MV 100)。TF1 ( 法国 的广播商)和Video Networks Limited (VNL)在 伦敦 的家用视频点播服务已经宣布使用该䠧品。 佩斯公司(Pace Micro)为一些主要的直播卫星公司提侠了机顶盒。 Sony 公司的 PSP ( PlayStation Portable )在硬件上提供对H.264 Main Profile Level 3解码的支持。 Nero Digital 公司推出的由 Nero AG 和 Ateme 共同开发的软件包提供了对H.264编码皠支持,并在 Doom9 获得"Pick Hit"奖项。 Sorenson 提供了H.264实现方式。相关的编解码轠件 Sorenson AVC Pro codec 已经包含在 Sorenson Squeeze 4.1 for MPEG-4 中。 自由软件版 x264 的编解码软件采用 GPL 授权方式下载。 最新消息:InterVideo砄WinDVD 7 于2005年6月24日正式发布。发布版本分 ??WinDVD 7 Gold黄金版和WinDVD 7 Platinum白金版,白金版支持H.264/MPEG-4 AVC解码播放,推荐配置为P4 3.6G。(不属于原文) 最新消息:ATi 2005年10月5日发布的Radeon X1300、X1600、X1800系列图形芯片支持H.26 硬件加速解码。
外部链接
- H.264/AVC综述文章,包含了新的高精度栓展(Sullivan, Topiwala, and Luthra)
- 一些有关H.264/AVC的文章(Wiegand)
- 更多的关于H.264/AVC的文章(Marpe)
- H.264/AVC参考软件
- H.264/MPEG-4 Part 10教程 (Richardson)
- 书: H.264 and MPEG-4 Video Compression (Richardson)
fr:H.264
- JVT Experts Group 文档
- MPEG LA 关于H.264/MPEG-4 AVC专利授权的条款
- ndard.html VIA Licensing 關於 H.264/MPEG-4 AVC 專利授權的訊息
- 一个基于GPL的H.264编码库,支持大部删H.264的功能
- MPEG工业论坛
- ders&lang=e&parent=T-REC-H.264 ITU-T 官方网页
- ogueDetail?CSNUMBER=40890&ICS1=35&ICS2=40&ICS3= H.264 ISO 官方网页
- W&W Communications H.264 概述和IEEE文章
- 苹果公司H.264素材实例
de:H.264
en:H.264/MPEG-4 AVC
es:H.264/MPEG-4 AVC
fi:H.264
- H.264/AVC 教科书 (日文: Okubo, Kadono, Kikuchi, and Suzuki)
he:H.264
it:H.264
pl:AVC
阅读(869) | 评论(0) | 转发(0) |