MPEG-4编/解码设计与剖析（1）-fglswh-ChinaUnix博客

Embeded Linux

首页　| 　博文目录　| 　关于我

fglswh

博客访问： 2324697
博文数量： 668
博客积分： 10016
博客等级：上将
技术积分： 8588
用户组：普通用户
注册时间： 2008-05-29 19:22

文章分类

全部博文（668）

VxWorks（1）
Audio（22）
Video（74）
Win32（3）
SVN（3）
DSP（1）
FileSystem（15）
System Porting（12）
Motivation（4）
Hardware Microch（19）
all other stuff（23）
Electronics（49）
Memory Managemen（32）
Linux Administra（32）
Application deve（65）
BootLoader（56）
Algorithm&Data S（17）
Linux Shell（12）
Kernel（82）
Driver（67）
ARM（24）
C/C++（54）
未分配的博文（1）

文章存档

2011年（1）

2010年（2）

2009年（273）

2008年（392）

我的朋友

最近访客

推荐博文

MPEG-4编/解码设计与剖析（1）

分类：

2009-08-14 10:44:36

14.2.1 MPEG-4编/解码设计与剖析（1）

XviD CODEC以动态库和静态库的形式供应用程序使用。这里以静态库为对象，展现视频编码和解码的设计过程。通过代码分析深入掌握视频编/解码的工作原理。XviD的MPEG-4算法的视频编码和解码在同一个工程中。视频编码使用一个函数，根据传入的参数决定初始化、编码和销毁编码器，视频解码函数调用与之类似。

1．MPEG-4视频编码

XviD的MPEG-4视频编码支持档级，并且绝大部分的视频应用不超过720像素 576像素的分辨率，尽管XviD最高可支持4096像素 4096像素分辨率的视频编码。而实际上在视频监控应用中，CIF（352像素 288像素）分辨率更常用。另外，尽管XviD CODEC支持高档应用：B帧编码、1/4精度像素和全局运动补偿GMC。但是在使用如DSP硬件编码时，这些功能是简化了的，即实现MPEG-4的SP档级。而在PC上开发XviD MPEG-4算法时，这些高档应用可以考虑打开，但是大量额外的计算量与获得的编码性能并不成比例。所以在后面的介绍中及在实际的应用中也确实如此，以MPEG-4的SP档级为主要介绍对象。

MPEG-4视频编码是典型的混合编码技术，即使用变换、量化和编码三步骤对图像数据或图像差值作处理。I帧（关键帧Key Frame）是帧内编码，即对图像数据做编码，利用了图像的空间冗余；P帧编码主要是利用前向预测，对宏块差值编码，利用了图像的时间冗余。统计来看，P帧编码是主流，因为I帧有一定的间隔。P帧编码中的技术核心是搜索与当前宏块的最佳匹配块，即运动估计，搜索的窗口越大，宏块越匹配，但随之运算量也就越大。运动估计技术（Motion Estimation，ME）是任何视频编码算法的核心。这里以图像大小为352像素 288像素、格式为I420、编码I、P帧为例介绍MPEG-4视频编码流程，如图14-1所示。

（点击查看大图）图14-1 MPEG-4视频编码流程框图

每个模块的功能简要介绍如下。

从文件中读取一帧图像，大小为352像素×288像素×3/2（包含了亮度和色度）。

以宏块为单位进行编码，一帧图像中所有宏块编码完成，也就完成了对当前帧的编码。

对当前宏块进行运动估计（如果是I帧，则不用），根据SAD值决定匹配块。

对8 8块进行编码，按照其在宏块中排列的顺序进行。首先将当前宏块同参考宏块作差值，然后再对差值进行编码（I帧不用）。

对当前编码块（或者经过运动补偿的差值）进行DCT变换。

对DCT变换后的系数进行量化。

反量化模块是量化模块的逆过程。

反DCT模块是DCT模块的逆过程。

AC/DC预测，即在编码I帧时，对当前宏块的第一行或者第一列系数同它周围的某一块作一个差值，进一步增加零系数，降低比特率。

反DCT后的宏块作运动补偿得到当前宏块的重建值，称为重建宏块。

码流合并模块，形成最后的视频编码码流。码流由码流头开始，然后是具体的帧。在编码之前，模块首先向输出流文件中写入码流头信息。然后写入第一帧的内容，每一帧同样由帧头信息开始，帧头信息同当前的编码内容是紧密相关的，后面的帧数据必须完全符合它规定的一些特性，譬如当前帧的量化值、运动补偿的搜索范围等。接下来是具体的帧数据，并且是按照宏块组织的。宏块内容包含当前宏块的编码信息，例如当前宏块是否编码、编码类型等，接着是运动矢量的数据，最后是具体的6个块的数据。

XviD CODEC为了检测运行平台的CPU，在编/解码器初始化前，给开发者提供了可以指定平台的接口，另外程序也能够自动检测CPU。然后针对不同的平台初始化核心模块的函数指针，编码和解码前都要做该项工作。

     //………………
xvid_gbl_init.cpu_flags = 0; //程序自动检测
xvid_global(NULL, XVID_GBL_INIT, &xvid_gbl_init, NULL);
//………………
int xvid_global(void *handle, int opt, void *param1, void *param2)
{
switch(opt) {
case XVID_GBL_INIT :   //初始化内部的函数指针、VLC码表和图像空间转换函数
return xvid_gbl_init((xvid_gbl_init_t*)param1);
case XVID_GBL_INFO :  //返回编码器的一些信息通知给主机
return xvid_gbl_info((xvid_gbl_info_t*)param1);
case XVID_GBL_CONVERT :  //颜色转换
return xvid_gbl_convert((xvid_gbl_convert_t*)param1);
default :
return XVID_ERR_FAIL;
}
}

上述代码在调用初始化编码前调用一次，主要是初始化内部的函数指针，如通过检测CPU平台，使用MMX或SSE指令优化的函数初始化函数指针，创建VLC熵编码的码表等。主要函数为xvid_gbl_init。

XviD的MPEG-4编码算法实现以一个函数及其3个不同的参数传递来完成。

/*------------------------------编码器操作-------------------------------*/
#define XVID_ENC_CREATE  0 /* 创建编码器实例;0代表成功*/
#define XVID_ENC_DESTROY 1 /* 销毁编码器实例;0代表成功*/
#define XVID_ENC_ENCODE  2 /* 编码一帧图像：返回编码后的字节数
* 0表示该帧不用写入文件（如编码器滞后或延迟） */
/*-----------------------------编码器入口函数-----------------------------*/
extern int xvid_encore(void *handle, int opt, void *param1, void *param2);

编码器的入口函数xvid_encore的实现如下：

int xvid_encore(void *handle, int opt, void *param1, void *param2)
{
switch (opt) {
case XVID_ENC_ENCODE:    //XviD编码一帧图像
return enc_encode((Encoder *) handle,(xvid_enc_frame_t *) 
param1,(xvid_enc_ stats_t *) param2);
case XVID_ENC_CREATE:    //XviD创建编码器
return enc_create((xvid_enc_create_t *) param1);
case XVID_ENC_DESTROY:   //XviD销毁编码器
return enc_destroy((Encoder *) handle);
default:
return XVID_ERR_FAIL;
}
}

阅读(1458) | 评论(0) | 转发(0) |

上一篇：JPEG 原理详细实例分析及其在嵌入式 Linux 中的应用

下一篇：MPEG-4编/解码设计与剖析（2）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6