视频编解码学习之三：变换，量化与熵编码-hiyachen-ChinaUnix博客

架构师（云操作系统AI微服务）hiyachen.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

hiyachen

博客访问： 7161002
博文数量： 704
博客积分： 10821
博客等级：上将
技术积分： 12052
用户组：普通用户
注册时间： 2005-12-02 10:41

个人简介

中科院云平台架构师，专注于数字化、智能化，技术方向：云、Linux内核、AI、MES/ERP/CRM/OA、物联网、传感器、大数据、ML、微服务。

文章分类

全部博文（704）

云平台云计算（129）

未分类（0）

openstack（10）

分布式文件系统（3）

网络虚拟化（11）

容器云（1）

KVM-Libvirt（1）
大数据及数据挖掘（48）

spark（6）

算法（3）

hadoop（3）

mongodb（5）
Python（6）

python2（2）

python3（0）
linux-unix（72）

glusterrfs（8）

IPC（0）

文件系统（2）

AIX（1）

unix（34）
Java（170）

安全策略（4）

osgi（0）

AjAx（7）
数据库（70）

postgresql（0）

sqlite（0）

Redis(内存数据库（2）

Mysql（7）

Oracle_DB2_Sqlse（56）
Web（34）
网络与运维（19）

监控（3）
软件及系统架构（70）

金融（0）

移动开发（0）

UML（2）
中间件（2）

CICS（0）

Tuxedo（0）
C/C++（6）
PHP（3）
Others（19）

VBA||C#（3）

regExp（4）

Shell_Dos（5）
BPM（6）

JBPM（2）

工作流（4）
程序与人生（29）

Think（5）

Japan（3）
未分配的博文（21）

推荐博文

相关博文

视频编解码学习之三：变换，量化与熵编码

分类：架构设计与优化

2018-02-10 10:29:18

第6章变换编码

1. 变换编码

变换编码的目的
- 去除空间信号的相关性
- 将空间信号的能力集中到频域的一小部分低频系数上
- 能量小的系数可通过量化去除，而不会严重影响重构图像的质量
块变换和全局变换
- 块变换：离散余弦变换(Discrete Cosine Transform，DCT)，4x4，8x8，16x16
- 全局变换：小波变换(Wavelet)
变换的能量集中特性
- DCT编码

2. 变换类型

K-L变换
傅里叶变换
余弦变换
小波变换

3. KL变换

最优变换
基函数根据具体图像而确定
没有快速算法
实际中很少使用
- 复杂度极高

K-L变换非常复杂度很高，不实用
- 需要计算协方差矩阵U
- 需要计算特征向量
- 需要发送到解码器

4. 离散傅立叶变换

5. 离散傅立叶变换性质

6. 离散余弦变换

比K-L变换，傅里叶变换的复杂度更低
变换性能仅次于K-L变换
有快速算法可以加快变换速度
可以用整数变换进一步降低复杂度

7. DCT与DFT的关系

8. 离散余弦变换的重要性质

9. 快速DCT变换

下图是一个动态展示：

10. 整数离散余弦变换

离散余弦变换为浮点操作
- 需要64位精度
- 浮点计算复杂度高
- 变换精度高
整数变换：离散余弦变换的整数近似
- 需要更少的位宽
- 整数计算复杂度低
- 好的整数变换的变换精度接近浮点变换
浮点近似方法

11. H.264的4x4整数变换

12. 小波变换

新的变换方法
避免由于块编码带来的块效应
更适合视频空间可分级编码

第7章量化

1. 量化Quantization

用更小的集合表示更大的集合的过程
- 对信号源的有限近似
- 有损过程
- 应用
  - A/D转换
  - 压缩
- 量化方法
  - 标量(Scalar)量化
  - 矢量(Vector)量化

2. 量化的基本思想

映射一个输入间隔到一个整数
减少信源编码的bit
一般情况重构值与输入值不同

3. 量化模型

4. 量化的率失真优化

量化器设计问题
- 量化水平的个数，即Bin的个数
- 决策边界：Bin的边界
- 重构水平
量化器设计是对率失真的优化
- 为了减少码率的大小，需要减少Bin的个数
- Bin的个数减少导致重构的误差增大，失真也就随着增大

5. 失真测量

6. 量化器设计

量化器设计的两个方面
- 给定量化水平数目M，找到决策边界x_i和重构水平使MSE最小
- 给定失真限制D，找到量化水平数目M，决策边界x_i和重构水平y_i使MSE<=D

7. 均匀量化（Uniform Quantization）

8. 量化与峰值信噪比

9. 中升量化器（Midrise Quantizer）

10. 中平量化器（Midtread Quantizer）

11. 死区量化器（Deadzone Quantizer）

12．非均匀量化（Non-uniform Quantization）

如果信源不是均匀分布的，采用均匀量化不是最优的
对于非均匀量化，为了减少MSE，当概率密度函数f_X(x)高时，使Bin的量化步长减小，当概率密度函数f_X(x)低时，使Bin的量化步长增加。

13. 最优的标量量化

14. 量化编码

定长编码量化水平
- 使用等长的码字编码每个量化水平，码字长为：
熵编码量化水平
- 根据量化水平的概率分布情况，用变长的码字编码每个量化水平
- 平均码字长
- 比定长编码量化水平效率高
- 广泛应用在图像和视频编码中

15. 矢量量化

标量量化：对数据一个一个的进行量化，称为标量量化。
矢量量化：将数据分组，每组K个数据构成K维矢量，再以矢量为处理单元进行量化。
- 矢量量化是标量量化的多维扩展
- 标量量化是矢量量化的特殊情况
矢量量化工作过程

二维矢量量化

矢量量化优点
- 只传码字的下标，编码效率高
- 在相同码率下，比标量量化失真小
- 在相同失真下，比标量量化码率低
矢量量化缺点：复杂度随着维数的增加呈指数增加

第8章熵编码

1. 熵编码

熵（Entropy）：信源的平均信息量，更精确的描述为表示信源所有符号包含信息的平均比特数
- 信源编码要尽可能的减少信源的冗余，使之接近熵
- 用更少的比特传递更多的信源信息
熵编码：数据压缩中根据信源消息的概率模型使消息的熵最小化
- 无损压缩
- 变长编码

2. 熵

信息量：

单位：比特

熵：

单位：比特/符号

3. 定长编码

4. 变长编码

变长编码：用不同的比特数表示每一个符号
- 为频繁发生的符号分配短码字
- 为很少发生的符号分配长码字
- 比定长编码有更高的效率
常用的变长编码
- Huffman编码
- 算术编码

5. Huffman编码

前缀码：任何码字不是其它码字的前缀
- 如果011为一个有效码字，则0，1，01，11必不是有效码字
- 不会引起解码歧义
Huffman：
- 二叉树
- 树节点:表示符号或符号组合
- 分支:两个分支一个表示"0"，另一个表示"1"

Huffman的不唯一性
- 每次分支有两种选择：0，1
- 相同的概率产生不同的组合
缺点：
- 数据的概率变化难于实时统计
- Huffman树需要编码传输给解码器
- 只有在p(x_i)=1/2^ki时是最优编码
- 最小码字长度为1比特/符号
如果有二值信源，其两个符号的概率相差很大
- 例如：p(1)=0.0625，p(0)=0.9375则H=0.3373比特/符号，Huffman编码平均码长=1比特/符号
- 两个符号联合编码有更高效率

6. 扩展Huffman编码

7. 范式Huffman编码

范式Huffman树的建立规则
- 节点左支设为0，右支设为1
- 树的深度从左至右增加
- 每个符号被放在最先满足的叶子节点

特性
- 第一个码字是一串0
- 相同长度的码字的值是连续的
- 如果所有的码字通过在低位补0的方式，使所有码字的长度相同则有 0000<0100<1000<1010<1100<1110<1111
- 从码字长度n到n+1有如下关系
  - C(n+1,1)=(C(n,last)+1)<<1
- 从码字长度n到n+2有如下关系
  - C(n+2,1)=(C(n,last)+1)<<2

8. 一元码

编码一个非负整数n为n个1和一个0
不需要存储码表
可以用Huffman树表示
码长增长太快：n=100，码长101

9. 哥伦布编码

将信源符号等分成几组，每组有相应的编号
编号小的分配码字短，编号大分配码字长
同组的符号有等长的码字，比一元码的码字长度增长慢
码字分配

10. 指数哥伦布编码

哥伦布码对信源符号的分组大小相同
指数哥伦布码对信源符号的分组大小按照指数增长
指数哥伦布码依然是一元码加定长码的形式
指数哥伦布码的指数k=0，1，2，…

11. CAVLC（ Context-Based Adaptive Variable Length Code）

当前块的系数分布和其邻块的系数分布情况相关
- N_X为块X的非零系数个数，当前块C的第一个系数的编码码表由N_C决定， N_C=( N_A+ N_B)/2
当前待编码系数和前面编码系数有相关性
- 当前块C的其它系数的编码码表由前一个系数的幅值决定cof_N-1=>GolombTab_x，用GolombTab_x编码cof_N

12. 算术编码

信息量=>符号编码比特数
Huffman编码为每个符号分配一个码字，这说明Huffman编码的压缩上限是1比特/符号
算术编码若干个符号可编码成1bit
算术编码是把信源表示为实数轴上[0,1]区间，信源中每个符号都用来缩短这个区间
- 输出[0,1]区间的一个实数表示一串编码符号
- 比Huffman编码更有效
编码思想
- 编码器用熵编码算法编码一串符号产生一个[0,1]区间的实数，将实数的一个二进制表示传给解码器
- 解码器用熵解码算法解码得到一串符号
小数的二进制表示
信源符号概率分布
字符串：X2 X2 X3 X3 X6 X5 X7
Huffman编码，01 01 100 100 00 11 1011，18bit