Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2117257
  • 博文数量: 438
  • 博客积分: 3871
  • 博客等级: 中校
  • 技术积分: 6075
  • 用 户 组: 普通用户
  • 注册时间: 2011-09-10 00:11
个人简介

邮箱: wangcong02345@163.com

文章分类

全部博文(438)

文章存档

2017年(15)

2016年(119)

2015年(91)

2014年(62)

2013年(56)

2012年(79)

2011年(16)

分类: LINUX

2016-07-12 11:00:09

有数据如下:
FFFE 3100 2000 3100 2000 0031 0020 0031
0020 0031 0020 0031 0020 0031 0020 0031
0020 0031 0020 0031 0020 0031 0020 000d
000a 0032 0020 0032 0020 0032 0020 0032
0020 0032 0020 0032 0020 0032 0020 0032
0020 000d 000a 0033 0020 0033 0020 0033
0020 000d 000a 0041 000d 000a 0042 0020
0042 000d 000a 0043 000d 000a

0,count=69    --> 0  
10,count=6    --> 10001 
13,count=6    --> 10111 
32,count=27   --> 11  
49,count=11   --> 1010 
50,count=12   --> 1001 
51,count=3    --> 10000  
65,count=1    --> 10110110  
66,count=2    --> 1011010  
67,count=1    --> 10110111 
254,count=1   --> 1011000  
255,count=1   --> 1011001

a. 第一遍先扫描出所有数据出现的频率
b. 选取所有数据中最小的两个数据组成左右结点
          65_1 67_1-->256_2
          254_1 255_1 -->257_2
          .....
          0_69  265_71 -->266_140
c. 按照左结点是0,右结点是1的方式编码,从上到下进行编码,每多一层bit数多1
例如10从上往下数是 右 左 左 左 右, 所以基编码是  100001
d.正式编码时一个一个字符进行编码
FF --> 1011001 
FE --> 1011000
31 --> 1010
00 -->   0
20 --> 11
00 --> 0
31 --> 1010
10110011    01100010  10011010
B3                 62                 9a

读出第1个字节FF,其编码为1011001不到8bit,剩余bit:1011001
读出第2个字节FE,其编码为1011000,与FF的7个bit组成10110011,写到输出B3剩余bit:011000
读出第3个字节31,其编码为1010与FE剩下的(7-1)=6组成01100010写到输出62,剩余bit:10

读出第4个字节00,其编码为0,不满8bit,剩余bit:100
读出第5个字节20,其编码为11,不满8bit,剩余bit:10011
读出第6个字节00,其编码为0,不满8bit,剩余bit:100110
读出第7个字节31,其编码为1010,组成10011010写到输出9a,剩余bit:10

d.解码时先从输出中构造上图所示的huffman树,然后读取第1个字节B3
B3-->10110011,从huffman树中按左0右1开始查找,第bit1=1说明是root的右结点
右左右右左左右  这时候到了叶子结点了,值为FF



阅读(1220) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~