数据结构(14)-哈夫曼树&哈夫曼编码

如题所述

第1个回答 2022-06-05

首先先来看四个和树相关的概念：

如上图所示，二叉树 a 中，结点 A 到结点 B 之间的路径长度为3，树的路径长度为1+1+2+2+3+3+4+4=20，树的带权路径长度为 5*1+15*2+40*3+30*4+10*4=315 。二叉树 b 中，结点 A 到结点 B 之间的路径长度为2，树的路径长度为1+2+2+3+3+1+2+2=16，树的带权路径长度为 5*3+15*3+40*2+30*2+10*2=220 。

计算我们构造的新二叉树的 WPL 为 40+30*2+15*3+4*5+4*10=205 ，比二叉树 b 还要小15。

图中红色字的结点即为原来的结点，黑色字的结点是新生成的结点。总结步骤如下：

哈夫曼树被发明出来的主要目的是解决当年远距离通信的数据传输最优化的问题。比如需传送的电报为 BADCADFEED ，它只用到6种字符，我们可以使用对应的二进制数来进行表示：

传输后的编码就是 001 000 011 010 000 011 101 100 100 011 。这种等长的编码虽然使用起来方便，但是编码结果太长，会占用过多的内存资源。如果我们对上述字母进制做一些修改：

此时，新生成的编码 001 01 00 101 01 00 1001 11 11 00 就比等长编码短了，节约了存储和传输成本。但是这种方式也有缺陷，比如一个字符的编码恰好是另一个字符编码的前缀，就会产生歧义。这时，哈夫曼编码 (Huffman Coding) 就登场了。它实现了两个重要的目标：

哈夫曼编码不是一套固定的编码，而是通过哈夫曼树，根据给定信息中各个字符出现的频次，动态生成最优的编码。假设需要编码的字符集为{ }，每个字符出现的次数为{ }，我们以为叶子结点，以为对应叶子结点的权值来构造一棵哈夫曼树，规定左分支为0，右分支为1，则从根结点到叶子结点所经过的路径分支组成的0和1的序列即为该结点的字符编码，这个编码就是哈夫曼编码。

下面我们就使用顺序存储结构来实现哈夫曼树及哈夫曼编码。由于结点存在权值，且我们使用的是顺序存储结构，可以通过下标来获取到左右孩子、双亲结点。

个叶子结点的二叉树会有个结点，构建哈夫曼树的时候，由于我们使用的是顺序存储结构，我们可以将叶子结点存放在前个位置，而非叶子结点，存放在后面，使用下标来标记。

生成哈夫曼编码时候，左孩子的编码记为0，右孩子的编码记为1。编码结构中首先要保存的是编码，由于编码可能存在多位，我们需要把读到第几位记录下来，另外还需要保存该字符的权值。

验证如下：

相似回答

数据结构(C语言)-哈夫曼(Huffman)树编码译码操作答：在C语言中，哈夫曼编码是一种优化数据传输的方法。通过构造以字符频率为权值的哈夫曼树，我们可以为每个字符分配一个独特的前缀编码，使得使用频率高的字符对应较短的编码，反之则较长。哈夫曼树的构建过程涉及从频率最低的字符开始，合并成新的节点，直至形成一棵完整的树。实现上，哈夫曼树的结点和编码...

[数据结构]哈夫曼树&K叉哈夫曼树&范式哈夫曼编码&编码位数的限制...答：对于哈夫曼编码位数的限制，例如在JPEG中要求编码长度不超过16bit，可以通过改变哈夫曼树结构，如通过增删节点来调整编码长度，同时保持编码的压缩效果。这种方法需要统计每个编码长度的符号数量，并根据限制条件调整，最后通过范式哈夫曼编码规则生成新的编码。

[数据结构]哈夫曼树&K叉哈夫曼树&范式哈夫曼编码&编码位数的限制...答：以A~E字母为例，原本ASCII编码需要48比特，但通过哈夫曼编码，我们能将其压缩至仅需15比特，这得益于树中频繁出现的符号获得了更短的编码，如A的编码为2001，B为11，C为01，D为000，E为10。哈夫曼编码的构建过程巧妙地利用了堆结构，如std::priority_queue，通过合并权值最小的节点，形成编码规则。

哈夫曼树和哈夫曼编码答：哈夫曼动态编码：动态哈夫曼编码使用一棵动态变化的哈夫曼树，对第t+1个字符的编码是根据原始数据中前t个字符得到的哈夫曼树来进行的，编码和解码使用相同的初始哈夫曼树，每处理完一个字符，编码和解码使用相同的方法修改哈夫曼树，所以没有必要为解码而保存哈夫曼树的信息。编码和解码一个字符所需的...

哈夫曼树与哈夫曼编码、集合答：前缀码（prefix code）：任何字符的编码都不是另一字符编码的前缀，可以无二义地解码用二叉树进行编码：（1）左右分支：0、1 （2）字符只在叶结点上只要待编字符在叶结点上，其二叉树编码都不是另一字符编码的前缀由哈夫曼树构造一棵编码代价最小的树例：集合运算：交集、并集...

数据结构——哈夫曼树(Huffman Tree)答：哈夫曼编码的构建过程包括统计字符频率，将频率作为权重放入优先队列，每次合并权值最小的两棵树，直至形成哈夫曼树。最后，通过遍历树的结构，为每个字符生成对应的哈夫曼编码，进一步实现压缩。总结来说，哈夫曼树是一种优化的结构，通过构建和利用其特性，可以有效地压缩数据，减少存储空间的需求。这种技术...

哈夫曼树及哈夫曼编码的C程序实现(数据结构题)答：// w存放n个字符的权值(均>0)，构造哈夫曼树HT，// 并求出n个字符的哈夫曼编码HC int i, j;char *cd;int p;int cdlen;if (n<=1) return;m = 2 * n - 1;HT = (HuffmanTree)malloc((m+1) * sizeof(HTNode)); // 0号单元未用 for (i=1; i<=n; i++) { //初始化...

哈夫曼树和哈夫曼编码答：a=5 b=29 c=7 d=8 e=14 f=23 g=3 h=11

大家正在搜

数据结构哈夫曼树编码代码根据哈夫曼树求哈夫曼编码根据哈夫曼编码画出哈夫曼树哈夫曼树的建立及哈夫曼编码哈夫曼编码的数据结构哈夫曼编码用到哪种数据结构怎样求哈夫曼编码数据结构数据结构哈夫曼编码例题数据结构哈夫曼树