Chinaunix首页 | 论坛 | 博客
  • 博客访问: 314897
  • 博文数量: 79
  • 博客积分: 1480
  • 博客等级: 上尉
  • 技术积分: 848
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-11 15:29
文章分类

全部博文(79)

文章存档

2012年(1)

2011年(5)

2010年(19)

2009年(54)

我的朋友

分类: 嵌入式

2009-09-22 15:37:00

1、封装格式   
   所谓封装格式就是将已经编码压缩好的视频轨和音频轨按照一定的格式放到一个文件中,也就是说仅仅是一个外壳,或者大家把它当成一个放视频轨和音频轨的文件夹也可以。

    说得通俗点,视频轨相当于饭,而音频轨相当于菜,封装格式就是一个碗,或者一个锅,用来盛放饭菜的容器。有的人可能觉得奇怪,容器,不就能盛放饭菜就行了么,用一个碗就可以了,何必制定出这么多的格式以及规范呢?

    其实不然,试想一下,有的菜,例如排骨,比较大,碗放不下,得换锅。有的饭比较烫,也不能放在塑料的容器里,当然个人喜好也有一定关系。所以容器的选择,基本在于,其对视频/音频兼容性,以及适合范围。这下大家应该明白了,很多人一直把封装格式当成前面介绍的视频编码,而这两者之间没有必然的直接联系。

2、AVI简介

    AVI格式是音频视频交错(Audio Video Interleaved)的英文缩写

    AVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,但AVI文件并未限定压缩标准, 因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性,用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法才能播放出来。常用的AVI播 放驱动程序,主要是Microsoft Video for Windows或Windows 95/98中的Video 1,以及Intel公司的Indeo Video。

    AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被广泛使用。

    AVI的文件结构、分为头部, 主体和索引三部分. 主体中图像数据和声音数据是交互存放的。从尾部的索引可以索引跳到自己想放的位置。

    AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编码形式。因为索引放在了文件尾部,所以在播internet流媒体时已属力不从心。很简单的例子,从网络上下载的片子,如果没有下载完成,是很难正常播放出来。

高清知识普及讲座 封装格式详解-AVI篇

    另外一个问题是AVI对高码率VBR音频文件支持不好。VBR全称是Variable BitRate,就是动态比特率,可以根据当前的需要定义不同的比特率,避免了浪费,并且提高了利用率。随之问题也就来了,因为容器里的图像和声音是分开 的,所以播放时需要一个图像和声音的同步过程,如果CBR音轨的话因为码率是定值,同步不成为问题,可是VBR音轨是不断的在变换,而AVI没有时间戳去 让VBR音轨和图像同步,这样就会产生图像声音不同步的问题。

    后来VirtualDub提出了一种新的方法扩充了AVI对VBR音频的兼容,但是在高码率时会产生丢失数据的问题,从而导致有损音效,这一点问题到现在都没有比较完美的解决方法。并且更加令人遗憾的是,对TrueHD, DTS-HD等音效更是完全不能支持。


3、RIFF

在介绍AVI文件前,我们要先来看看RIFF文件结构。AVI文件采用的是RIFF文件结构方式,RIFF(Resource Interchange File Format,资源互换文件格式)是微软公司定义的一种用于管理windows环境中多媒体数据的文件格式,波形音频wave,MIDI和数字视频AVI 都采用这种格式存储。构造RIFF文件的基本单元叫做数据块(Chunk),每个数据块包含3个部分,

1、4字节的数据块标记(或者叫做数据块的ID)

2、数据块的大小

3、数据

整个RIFF文件可以看成一个数据块,其数据块ID为RIFF,称为RIFF块。一个RIFF文件中只允许存在一个RIFF块。RIFF块中包含一 系列的子块,其中有一种字块的ID为"LIST",称为LIST,LIST块中可以再包含一系列的子块,但除了LIST块外的其他所有的子块都不能再包含 子块。

RIFF和LIST块分别比普通的数据块多一个被称为形式类型(Form Type)和列表类型(List Type)的数据域,其组成如下:

1、4字节的数据块标记(Chunk ID)

2、数据块的大小

3、4字节的形式类型或者列表类型

4、数据


4、AVI文件结构

下面我们看看AVI文件的结构。AVI文件是目前使用的最复杂的RIFF文件,它能同时存储同步表现的音频视频数据。AVI的RIFF块的形式类型是AVI,它包含3个子块,如下所述:

1、信息块,一个ID为 "hdrl"的LIST块,定义AVI文件的数据格式。

2、数据块,一个ID为 "movi"的LIST块,包含AVI的音视频序列数据。

3、索引块,ID为 "idxl"的子块,定义 "movi"LIST块的索引数据,是可选块。

AVI文件的结构如下图所示,下面将具体介绍AVI文件的各子块构造。

1、信息块,信息块包含两个子块,即一个ID为 avih 的子块和一个ID 为 strl 的LIST块。

AVI文件结构

typedef struct {
        MainAVIHeader     avi_mainhdr;
        AVIStreamHeader   strh_vd;
        BitMapInfoHeader  strf_vd;
        AVIStreamHeader   strh_au;
        WaveFormat        str_au;
       
        char *filename;
        FILE *fp;

        // LIST hdr1 position and size
        unsigned long list_hdr1_pos;
        int           list_hdr1_size;

       // LIST movi position and size
        unsigned long list_movi_pos;
        int           list_movi_size;
 
       // LIST rec position use in audio and video frame
        unsigned long list_rec_pos;
        int           list_rec_count

       // chunk idex position
        unsigned long idex_pos;
 
       // use in get next audio or video frame
        unsigned long current_fp;

       // use in get_aduio_frame, count the size
        int audio_count;

       //buffer use to store the last chunk data
        unsigned char audio_buf[AUDIO_SIZE];

       // the last chunk data size
        int audio_res;
} AVI_FILE;

"avih"子块的内容可由如下的结构定义:

typedef struct {
      unsigned long       dwMicroSecPerFrame;   //显示每帧所需的时间ns,定义avi的显示速率
     unsigned long        dwMaxBytesPerSec;        // 最大数据传输率
     unsigned long        dwReserved1;                       // 保留的1位
    unsigned long         dwFlags;                                   // AVI文件特殊属性,如是否包含索引块,音视频数据是否交叉
    unsigned long         dwTotalFrames;                 // 文件中的总帧数
    unsigned long         dwInitialFrames;              // 说明在开始播放前需要多少帧
    unsigned long         dwStreams;                          // 文件中包含的数据流总类
    unsigned long         dwSuggestedBufferSize ;   //建议使用的缓冲区大小
    unsigned long         dwWidth;                                // 图像宽
    unsigend long         dwHeight;                              //图像高
   unsigend long          dwRate;                                
// dwScale/dwRate = 每秒采样率
   unsigned long          dwStart;                               // 数据源开始播放的位置,以dwScale为单位
   unsigned long          dwLength;                           // 数据流的数据量,以dwScale为单位
}MainAVIHeader;    

"strl" LIST块用于记录AVI数据流,每一种数据流都在该LIST块中占有3个子块,他们的ID分别是"strh","strf", "strd";

"strh"子块由如下结构定义。

typedef struct{
      unsigned long fccType;             // 4字节,表示数据流的种类:vids为视频;auds为音频
      unsigned long fccHandler;         // 4字节,表示数据流解压缩的驱动程序代号
      unsigend long dwFlags;            // 数据流属性
      unsigned long dwPriority;         // 此数据流的播放优先级
      unsigned long dwInitialFrames;    // 说明在开始播放前需要多少帧
      unsigned long dwScale;            // 数据量, 视频每帧的大小或者音频的采样大小
      unsigned long dwRate;             // dwScale/dwRate = 每秒采样率
      unsigned long dwStart;            // 数据源开始播放的位置,以dwScale为单位
      unsigned long dwLength;           // 数据流的数据量,以dwScale为单位
      unsigned long dwSuggestedBufferSize;    // 建议的缓冲区大小
      unsigned long dwQuality;          // 解压缩质量参数,值越大,质量越好
      unsigned long dwSampleSize;       // 音频的采样大小
      unsigned short rcFrame[4];        // 视频图形所占的矩形
}AVIStreamHeader;


"strf"子块紧跟在"strh"子块之后,其结构视"strh"子块的类型而定,如下所述;如果 strh子块是视频数据流,则 strf子块的内容是一个与windows设备无关位图的BIMAPINFO结构,如下:

typedef struct tagBitMapInfo {
        BitMapInfoHeader bmiHeader;
        RGBQuad          bmiColors[1];  // 颜色表
}BitMapInfo;

typedef struct {
        unsigned long    biSize;
        unsigned long    biWidth;
        unsigned long    biHeight;
        unsigned short   biPlanes;
        unsigned short   biBitCount;
        unsigned long    biCompression;
        unsigned long    biSizeImage;
        unsigned long    biXPelsPerMeter;
        unsigned long    biYPelsPerMeter;
        unsigned long    biClrUsed;
        unsigned long    biClrimportant;
} BitMapInfoHeader;


如果 strh子块是音频数据流,则strf子块的内容是一个WAVEFORMAT结构,如下:

typedef struct {
       unsigned short wFormatTag;
       unsigned short nChannels;               // 声道数
       unsigned long nSamplesPerSec;           // 采样率
       unsigned long nAvgBytesPerSec;          //
WAVE声道中每秒的数据量
       unsigned short nBlockAlign;             // 数据块对其标志
       unsigned short nBitsPerSample;
       unsigned short cbSize;                  // 此结构大小(22)
}WaveFormat; //18


"strd"子块紧跟在strf子块后,存储供压缩驱动程序使用的参数,不一定存在,也没有固定的结构。

"strl" LIST块定义的AVI数据流依次将 "hdrl " LIST 块中的数据流头结构与"movi" LIST块中的数据联系在一起,第一个数据流头结构用于数据流0,第二个用于数据流1,依次类推。

数据块中存储视频和音频数据流,数据可直接存于 "movi" LIST块中。数据块中音视频数据按不同的字块存放,其结构如下所述,

音频字块

"##wb"

Wave 数据流

视频子块中存储DIB数据,又分为压缩或者未压缩DIB,

"##db"

RGB数据流

"##dc"

压缩的图像数据流

看到了吧,avi文件的图像数据可以是压缩的,和非压缩格式的。对于压缩格式来说,也可采用不同的编码,也许你曾经遇到有些avi没法识别,就是因 为编码方式不一样,如果没有相应的解码,你就没法识别视频数据。AVI的编码方式有很多种,比较常见的有 mpeg2,mpeg4,divx等。

索引块,索引快包含数据块在文件中的位置索引,能提高avi文件的读写速度,其中存放着一组AVIINDEXENTRY结构数据。如下,这个块并不是必需的,也许不存在。

typedef struct {
      unsigned long ckid;                                  // 记录数据块子块的标记
      unsigned long dwFlags;                        // 表示chid所指字块的属性
      unsigned long dwChunkOffset;          // 字块的对应位置
      unsigned long dwChunkLength;       // 字块长度
};


文件:AVI.pdf
大小:208KB
下载:下载



阅读(1896) | 评论(0) | 转发(0) |
0

上一篇:晚上饿了吃什么

下一篇:WCG回顾(上)

给主人留下些什么吧!~~