JPEG文件编/解码详解（一）-Liuqz2009-ChinaUnix博客

人生一路，几多起伏，昨日花开，今日凋谢，谁能自主。liuqz2009.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Liuqz2009

博客访问： 2200071
博文数量： 361
博客积分： 10828
博客等级：上将
技术积分： 4161
用户组：普通用户
注册时间： 2010-01-20 14:34

文章分类

全部博文（361）

Mysql（3）
Linux应用（54）

基础（16）

脚本（2）

配置（22）

命令（14）
Linux编程（80）

线程（6）

网络编程（6）

函数详解（21）

基础-编程（47）
Linux设备驱动（52）

LDD3（24）

网络设备驱动（3）

块设备驱动（2）

公共-驱动（14）

字符设备驱动（9）
USB（10）

USB公共（3）

USB HID（4）

USB枚举（0）

USB Mass（3）
Linux文件系统（17）

基础-文件系统（0）

proc（2）

busybox（4）
BootLoader（29）
杂项（1）
FAT（3）
编码（33）

视频编码（25）

音频编码（5）

字库编写（3）
单片机（24）

ARM（4）

外设驱动（1）

51单片机特殊用法（6）

网络（1）

键盘（7）

输入法（4）
Flash（13）

NandFlash（7）

NorFlash（2）
VOIP（12）

RTP/SRTP/RTCP（6）
Linux内核（17）

内核分析（12）

Linux0.11学习笔（0）

内核编译与移植（4）
基础概念（13）
未分配的博文（0）

文章存档

2011年（132）

2010年（229）

我的朋友

相关博文

JPEG文件编/解码详解（一）

分类： LINUX

2011-05-12 13:58:33

JPEG文件编/解码详解

cat_ng 猫猫

JPEG（Joint Photographic Experts Group）是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会CCITT（The International Telegraph and Telephone Consultative Committee）与国际标准化组织ISO于1986年联合成立的一个小组，负责制定静态数字图像的编码标准。

小组一直致力于标准化工作，开发研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法，即JPEG算法。JPEG算法被确定为国际通用标准，其适用范围广泛，除用于静态图像编码外，还推广到电视图像序列的帧内图像压缩。而用JPEG算法压缩出来的静态图片文件称为JPEG文件，扩展名通常为*.jpg、*.jpe*.jpeg。

JPEG专家组开发了两种基本的压缩算法、两种数据编码方法、四种编码模式。具体如下：

压缩算法：

l 有损的离散余弦变换（Discrete Cosine Transform，DCT）；

l 无损的预测技术压缩。

数据编码方法：

l 哈夫曼编码；

l 算术编码；

编码模式：

l 基于DCT顺序模式：编/解码通过一次扫描完成；

l 基于DCT递进模式：编/解码需要多次扫描完成，扫描效果从粗糙到精细，逐级递进；

l 无损模式：基于DPCM，保证解码后完全精确恢复到原图像采样值；

l 层次模式：图像在多个空间多种分辨率进行编码，可以根据需要只对低分辨率数据作解码，放弃高分辨率信息。

在实际应用中，JPEG图像使用的是离散余弦变换、哈夫曼编码、顺序模式。

JPEG压缩编码算法的主要计算步骤如下：

(0) 8*8分块。

(1) 正向离散余弦变换(FDCT)。

(2) 量化(quantization)。

(3) Z字形编码(zigzag scan)。

(4) 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。

(5) 使用行程长度编码(RLE)对交流系数(AC)进行编码。

(6) 熵编码。

笔者在实践过程中查阅了大量的资料，发现大多数书籍资料和网上资料都是从编码角度分析JPEG的编/解码方式，并且都只是介绍编码过程中的主要方法。所以，本文从解码角度详细分析JPEG的编/解码过程，并且加入许多笔者实践过程中遇到的问题和解决方法，希望从另一个角度说明问题，以更好帮助读者结合其他资料解决问题。

不过，介绍解码过程之前，首先要了解JPEG文件中数据的存储格式。

一、JPEG文件格式介绍

JPEG文件使用的数据存储方式有多种。最常用的格式称为JPEG文件交换格式（JPEG File Interchange Format，JFIF）。而JPEG文件大体上可以分成两个部分：标记码(Tag)和压缩数据。

标记码由两个字节构成，其前一个字节是固定值0xFF，后一个字节则根据不同意义有不同数值。在每个标记码之前还可以添加数目不限的无意义的0xFF填充，也就说连续的多个0xFF可以被理解为一个0xFF，并表示一个标记码的开始。而在一个完整的两字节的标记码后，就是该标记码对应的压缩数据流，记录了关于文件的诸种信息。

常用的标记有SOI、APP0、DQT、SOF0、DHT、DRI、SOS、EOI。

注意，SOI等都是标记的名称。在文件中，标记码是以标记代码形式出现。例如SOI的标记代码为0xFFD8，即在JPEG文件中的如果出现数据0xFFD8，则表示此处为一个SOI标记。

本文附录列出一张完整的JPEG定义的标记表，供读者查阅。这里仅列出几个常用标记的标记代码、占用字节长度和表示的意义。

l SOI，Start of Image，图像开始

u 标记代码 2字节固定值0xFFD8

l APP0，Application，应用程序保留标记0

u 标记代码 2字节固定值0xFFE0

u  包含9个具体字段：
  ① 数据长度                         2字节     ①~⑨9个字段的总长度
                                                            即不包括标记代码，但包括本字段
  ② 标识符                             5字节    固定值0x4A46494600，即字符串“JFIF0”
  ③ 版本号                             2字节    一般是0x0102，表示JFIF的版本号1.2
                                                            可能会有其他数值代表其他版本
  ④ X和Y的密度单位           1字节     只有三个值可选
                                                            0：无单位；1：点数/英寸；2：点数/厘米
  ⑤ X方向像素密度               2字节     取值范围未知
  ⑥ Y方向像素密度               2字节     取值范围未知
  ⑦ 缩略图水平像素数目        1字节     取值范围未知
  ⑧ 缩略图垂直像素数目        1字节     取值范围未知
  ⑨ 缩略图RGB位图             长度可能是3的倍数           缩略图RGB位图数据

本标记段可以包含图像的一个微缩版本，存为24位的RGB像素。如果没有微缩图像（这种情况更常见），则字段⑦“缩略图水平像素数目”和字段⑧“缩略图垂直像素数目”的值均为0。

l APPn，Application，应用程序保留标记n，其中n=1～15(任选)

u 标记代码 2字节固定值0xFFE1~0xFFF

u  包含2个具体字段：
  ① 数据长度                         2字节     ①~②2个字段的总长度
                                                            即不包括标记代码，但包括本字段
  ② 详细信息            数据长度-2字节   内容不定

例如，Adobe Photoshop生成的JPEG图像中就用了APP1和APP13两个标记段分别存储了一幅图像的副本。

l DQT，Define Quantization Table，定义量化表

u 标记代码 2字节固定值0xFFDB

u  包含9个具体字段：
  ① 数据长度                  2字节            字段①和多个字段②的总长度
                                                            即不包括标记代码，但包括本字段
  ② 量化表        数据长度-2字节

a)         精度及量化表ID   1字节            高4位：精度，只有两个可选值
                                                              0：8位；1：16位
                                                低4位：量化表ID，取值范围为0～3

b) 表项 (64×(精度+1))字节例如8位精度的量化表
其表项长度为64×（0+1）=64字节

本标记段中，字段②可以重复出现，表示多个量化表，但最多只能出现4次。

l SOF0，Start of Frame，帧图像开始

u 标记代码 2字节固定值0xFFC0

u  包含9个具体字段：
  ① 数据长度           2字节     ①~⑥六个字段的总长度
                                              即不包括标记代码，但包括本字段
  ② 精度                 1字节     每个数据样本的位数
                                              通常是8位，一般软件都不支持 12位和16位
  ③ 图像高度           2字节     图像高度（单位：像素），如果不支持 DNL 就必须 >0
  ④ 图像宽度           2字节     图像宽度（单位：像素），如果不支持 DNL 就必须 >0
  ⑤ 颜色分量数        1字节     只有3个数值可选
                                              1：灰度图；3：YCrCb或YIQ；4：CMYK
                                              而JFIF中使用YCrCb，故这里颜色分量数恒为3
  ⑥颜色分量信息      颜色分量数×3字节（通常为9字节）

a) 颜色分量ID 1字节

b)        水平/垂直采样因子      1字节            高4位：水平采样因子
                                                       低4位：垂直采样因子
                                                       （曾经看到某资料把这两者调转了）

c) 量化表 1字节当前分量使用的量化表的ID

本标记段中，字段⑥应该重复出现，有多少个颜色分量（字段⑤），就出现多少次（一般为3次）。

l DHT，Difine Huffman Table，定义哈夫曼表

u 标记代码 2字节固定值0xFFC4

u  包含2个具体字段：
①数据长度                             2字节            字段①和多个字段②的总长度
                                                                   即不包括标记代码，但包括本字段
② 哈夫曼表              数据长度-2字节

a)       表ID和表类型            1字节            高4位：类型，只有两个值可选
                                                                     0：DC直流；1：AC交流
                                                        低4位：哈夫曼表ID，
                                                                     注意，DC表和AC表分开编码

b) 不同位数的码字数量 16字节

c) 编码内容 16个不同位数的码字数量之和（字节）

本标记段中，字段②可以重复出现（一般4次），也可以致出现1次。例如，Adobe Photoshop 生成的JPEG图片文件中只有1个DHT标记段，里边包含了4个哈夫曼表；而Macromedia Fireworks生成的JPEG图片文件则有4个DHT标记段，每个DHT标记段只有一个哈夫曼表。

l DRI，Define Restart Interval，定义差分编码累计复位的间隔

u 标记代码 2字节固定值0xFFDD

u  包含2个具体字段：
①数据长度                             2字节     固定值0x0004，①~②两个字段的总长度
                                                            即不包括标记代码，但包括本字段
②MCU块的单元中的重新开始间隔
                                              2字节     设其值为n，则表示每n个MCU块就有一个
                                                           RSTn标记。第一个标记是RST0，第二个是
                                                            RST1等，RST7后再从RST0重复。

如果没有本标记段，或间隔值为0时，就表示不存在重开始间隔和标记RST

l SOS，Start of Scan，扫描开始 12字节

u 标记代码 2字节固定值0xFFDA

u  包含2个具体字段：
①数据长度                      2字节     ①~④两个字段的总长度
                                                     即不包括标记代码，但包括本字段
②颜色分量数                 1字节     应该和SOF中的字段⑤的值相同，即：
                                                     1：灰度图是；3： YCrCb或YIQ；4：CMYK。

                                                         而JFIF中使用YCrCb，故这里颜色分量数恒为3
   ③颜色分量信息
        a) 颜色分量ID           1字节
        b) 直流/交流系数表号 1字节     高4位：直流分量使用的哈夫曼树编号
                                                        低4位：交流分量使用的哈夫曼树编号

  ④ 压缩图像数据
        a)谱选择开始                     1字节     固定值0x00
        b)谱选择结束                     1字节     固定值0x3F
        c)谱选择                            1字节     在基本JPEG中总为00

本标记段中，字段③应该重复出现，有多少个颜色分量（字段②），就出现多少次（一般为3次）。本段结束后，紧接着就是真正的图像信息了。图像信息直至遇到一个标记代码就自动结束，一般就是以EOI标记表示结束。

l EOI，End of Image，图像结束 2字节

u 标记代码 2字节固定值0xFFD9

这里补充说明一下，由于在JPEG文件中0xFF具有标志性的意思，所以在压缩数据流(真正的图像信息)中出现0xFF，就需要作特别处理。具体方法是，在数据0xFF后添加一个没有意义的0x00。换句话说，如果在图像数据流中遇到0xFF，应该检测其紧接着的字符，如果是

1）0x00，则表示0xFF是图像流的组成部分，需要进行译码；

2）0xD9，则与0xFF组成标记EOI，则图像流结束，同时图像文件结束；

3）0xD0~0xD7,则组成RSTn标记，则要忽视整个RSTn标记，即不对当前0xFF和紧接的0xDn两个字节进行译码，并按RST标记的规则调整译码变量；

3）0xFF，则忽视当前0xFF，对后一个0xFF再作判断；

4）其他数值，则忽视当前0xFF，并保留紧接的此数值用于译码。

阅读(2081) | 评论(0) | 转发(0) |

上一篇：JPEG文件编/解码详解

下一篇：图像处理

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6