有数据如下:
FFFE 3100 2000 3100 2000 0031 0020 0031
0020 0031 0020 0031 0020 0031 0020 0031
0020 0031 0020 0031 0020 0031 0020 000d
000a 0032 0020 0032 0020 0032 0020 0032
0020 0032 0020 0032 0020 0032 0020 0032
0020 000d 000a 0033 0020 0033 0020 0033
0020 000d 000a 0041 000d 000a 0042 0020
0042 000d 000a 0043 000d 000a
0,count=69 --> 0
10,count=6 --> 10001
13,count=6 --> 10111
32,count=27 --> 11
49,count=11 --> 1010
50,count=12 --> 1001
51,count=3 --> 10000
65,count=1 --> 10110110
66,count=2 --> 1011010
67,count=1 --> 10110111
254,count=1 --> 1011000
255,count=1 --> 1011001
a. 第一遍先扫描出所有数据出现的频率
b. 选取所有数据中最小的两个数据组成左右结点
65_1 67_1-->256_2
254_1 255_1 -->257_2
.....
0_69 265_71 -->266_140
c. 按照左结点是0,右结点是1的方式编码,从上到下进行编码,每多一层bit数多1
例如10从上往下数是 右 左 左 左 右, 所以基编码是 100001
d.正式编码时一个一个字符进行编码
FF -->
1011001
FE --> 1011000
31 --> 1010
00 --> 0
20 --> 11
00 --> 0
31 --> 1010
10110011 01100010 10011010
B3 62 9a
读出第1个字节FF,其编码为1011001不到8bit,剩余bit:
1011001
读出第2个字节FE,
其编码为1011000,与FF的7个bit组成10110011,写到输出B3,剩余bit:011000
读出第3个字节31,其编码为1010与FE剩下的(7-1)=6组成01100010写到输出62,剩余bit:10
读出第4个字节00,其编码为0,不满8bit,剩余bit:100
读出第5个字节20,其编码为11,不满8bit,剩余bit:10011
读出第6个字节00,其编码为0,不满8bit,剩余bit:100110
读出第7个字节31,其编码为1010,组成10011010写到输出9a,剩余bit:10
d.解码时先从输出中构造上图所示的huffman树,然后读取第1个字节B3
B3-->10110011,从huffman树中按左0右1开始查找,第bit1=1说明是root的右结点
右左右右左左右 这时候到了叶子结点了,值为FF
阅读(1260) | 评论(0) | 转发(0) |