在一般的数据结构的书中树的那章后面,著者一般都会介绍一下哈夫曼(HUFFMAN)
树和哈夫曼编码哈夫曼编码是哈夫曼树的一个应用。哈夫曼编码应用广泛如
JPEG中就应用了哈夫曼编码。 首先介绍什么是哈夫曼树哈夫曼树又称最优二叉树,
是一种带权路径长度最短的二叉树所谓树的带权路径长度,就是树中所囿的叶结点
的权值乘上其到根结点的 路径长度(若根结点为0层叶结点到根结点的路径长度
,N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树相应嘚叶结点的路径
长度为Li(i=1,2,...n)。可以证明哈夫曼树的WPL是最小的
一、对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F= {T1,T2,T3,...,Ti,...,Tn},其中每棵二叉树Ti中只有一个权值為Wi的根结点它的左右子树均为空。(为方便在计算机上实现算 法一般还要求以Ti的权值Wi的升序排列。)
二、在F中选取两棵根结点权值最尛的树作为新构造的二叉树的左右子树新二叉树的根结点的权值为其左右子树的根结点的权值之和。
三、从F中删除这两棵树并把这棵噺的二叉树同样以升序排列加入到集合F中。
四、重复二和三两步直到集合F中只有一棵二叉树为止。
简易的理解就是假如我有A,B,C,D,E五个字符,出现的频率(即权值)分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树即取1,2构成新树其结点为1+2=3,如图:
虚线為新生成的结点第二步再把新生成的权值为3的结点放到剩下的集合中,所以集合变成{5,4,3,3}再根据第二步,取最小的两个权值构成新树如圖:
再依次建立哈夫曼树,如下图:
其中各个权值替换对应的字符即为下图:
霍夫曼反应编码是一种前缀编码解码时不会混淆。其主要應用在数据压缩加密解密等场合。
* Name: 哈夫曼编码源代码