分类:
2012-11-07 10:37:47
原文地址: Huffman编码构成过程 作者:iARM
下面几个图可以看到Huffman编码的构造过程是一个反复比较的过程,它总是选择两个使用频率较小的结点进行合并,生成出一个树,这个树经过编码后就会得到Huffman编码。
在上图中各点中的数字代表各点的使用次数,您可以把这几个方块想成A,B,C,D,它们在某一文章中的使用频率为7次,5次,1次等等。
选择使用率小的两个点1,3构成新点4。
在状态1图中选择5,4(也是两个最小的,注意不是1,3,因为1,3现在已经归在4里面了)进行合并。
在状态2表中的最小两个点已经变为7,6了,这时合并它们两个生成新点13。
只剩两个点了,不管多少它们也是最小的了,合并了算了。
请注意这个编码,每个点下面有两个分枝,分别编码为0,1,当然这是为了方便计算机及其它数字设备使用,您也可以编码为“张三”和“李四”。至此编码结束,所得到编码即从最上面的点延线下行,至所要编码的点,将沿路经过的0和1记录下来就是了。现在您应该明白为什么总是先把小的合并了吧,因为先合并的会在最下面,编码长度最长,而先合并的也是最不常使用的,因此编码长度最长也是应该的。
7 | 11 |
6 | 10 |
5 | 00 |
3 | 011 |
1 | 010 |