Chinaunix首页 | 论坛 | 博客
  • 博客访问: 370757
  • 博文数量: 242
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 1134
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-20 10:53
文章分类

全部博文(242)

文章存档

2015年(1)

2014年(10)

2013年(18)

2012年(213)

分类:

2012-11-07 10:37:47

原文地址: Huffman编码构成过程 作者:iARM

下面几个图可以看到Huffman编码的构造过程是一个反复比较的过程,它总是选择两个使用频率较小的结点进行合并,生成出一个树,这个树经过编码后就会得到Huffman编码。

Haffman0.gif (1837 bytes)

在上图中各点中的数字代表各点的使用次数,您可以把这几个方块想成A,B,C,D,它们在某一文章中的使用频率为7次,5次,1次等等。

Haffman1.gif (2065 bytes)

选择使用率小的两个点1,3构成新点4。

Huffman2.gif (2226 bytes)

在状态1图中选择5,4(也是两个最小的,注意不是1,3,因为1,3现在已经归在4里面了)进行合并。

Huffman3.gif (2557 bytes)

在状态2表中的最小两个点已经变为7,6了,这时合并它们两个生成新点13。

Huffman4.gif (2809 bytes)

只剩两个点了,不管多少它们也是最小的了,合并了算了。

Huffman5.gif (2835 bytes)

请注意这个编码,每个点下面有两个分枝,分别编码为0,1,当然这是为了方便计算机及其它数字设备使用,您也可以编码为“张三”和“李四”。至此编码结束,所得到编码即从最上面的点延线下行,至所要编码的点,将沿路经过的0和1记录下来就是了。现在您应该明白为什么总是先把小的合并了吧,因为先合并的会在最下面,编码长度最长,而先合并的也是最不常使用的,因此编码长度最长也是应该的。

711
610
500
3011
1010
阅读(271) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~