哈夫曼树学习

哈夫曼树(Huffman Tree)是一种特殊的二叉树,它根据给定的权值构造而成,并且其带权路径长度(WPL)达到最小。在计算机数据处理中,哈夫曼树常用来进行无损数据压缩,特别是通过哈夫曼编码实现。

定义

给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,则称这样的二叉树为最优二叉树,也称为哈夫曼树。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

构造

哈夫曼树的构造过程通常使用自底向上的方法。首先,将给定的权值从小到大排序,然后选取前两个最小的权值作为两个子节点,将它们的和作为父节点的权值,并将这两个子节点从序列中删除,将其父节点的权值加入序列中。然后,重新对序列进行排序,并重复上述步骤,直到序列中只剩下一个元素为止。这个元素就是哈夫曼树的根节点的权值。

性质

  1. 带权路径长度(WPL)最小:哈夫曼树的WPL是所有可能的二叉树中最小的。
  2. 权值越大的节点离根节点越近:这是为了使得出现频率高的节点(即权值大的节点)的编码长度更短,从而实现压缩的目的。

应用

哈夫曼树的主要应用之一是哈夫曼编码(Huffman Coding),它是一种可变长度编码方法。在哈夫曼编码中,出现频率高的符号使用较短的编码,而出现频率低的符号使用较长的编码。这样,编码后的字符串的平均长度会降低,从而达到无损压缩数据的目的。哈夫曼编码在数据通信、文件压缩等领域有着广泛的应用。

当然,以下是一些关于哈夫曼树的更多小知识点:

  1. 路径和路径长度:在树中,一个结点和另一个结点之间的分支即为这两个结点之间的路径;路径长度即为树中路径上的分支数目,即路径上所经过的边的个数。
  2. 权值:为树中每个叶子结点(度为1的结点)赋予一个数值,该值称为叶子结点的权值,简称为权。
  3. 带权路径长度(WPL):叶子结点的权值与树的根结点到该叶子结点之间的路径长度的乘积称为叶子结点的带权路径长度。整棵树的带权路径长度则是所有叶子结点的带权路径长度之和。
  4. 哈夫曼编码:哈夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码。出现频率高的符号使用较短的编码,出现频率低的符号使用较长的编码。这种编码方法使得编码后的字符串的平均长度降低,从而达到无损压缩数据的目的。
  5. 构造过程:构造哈夫曼树的过程主要包括初始化、选择、合并和重复等步骤。首先,将n个权值看作是n棵二叉树的根节点,构造n棵只有一个结点的二叉树。然后,在每次迭代中,选择权值最小的两棵树作为左右子树,构造一棵新的二叉树,并将这两棵树的权值相加作为新树的权值。重复这个过程,直到所有的树都被选中,最终构造出一棵哈夫曼树。
  6. 实际应用:哈夫曼树在实际中有许多应用,包括数据压缩、文件存储、图像处理、通信网络和数据库优化等。例如,在数据压缩中,哈夫曼树常用于实现哈夫曼编码,从而减少数据的大小并提高传输效率。
  7. 错误构造:在构造哈夫曼树时,可能会犯一些常见的错误。例如,在选择子树时不是选择根结点权值最小的两棵二叉树,或者没有严格按照哈夫曼算法进行构造等。这些错误

 


  
public class TriElement {  
  
    // 数据字段,通常用于存储字符的频率(在哈夫曼编码中)  
    int data;  
  
    // 父节点的索引,在数组中引用父节点  
    int parent;  
  
    // 左子节点的索引,在数组中引用左子节点  
    int left;  
  
    // 右子节点的索引,在数组中引用右子节点  
    int right;  
  
    // 构造方法,接受数据、父节点、左子节点和右子节点的索引  
    public TriElement(int data, int parent, int left, int right) {  
        super(); // 调用父类(Object)的无参构造方法,这是隐式的,通常可以省略  
        this.data = data; // 初始化当前对象的data字段  
        this.parent = parent; // 初始化当前对象的parent字段  
        this.left = left; // 初始化当前对象的left字段  
        this.right = right; // 初始化当前对象的right字段  
    }  
  
    // 另一个构造方法,仅接受数据字段,其余字段默认为-1(表示没有父节点或子节点)  
    public TriElement(int data) {  
        this(data, -1, -1, -1); // 调用上面的构造方法,并将parent、left和right设置为-1  
    }  
  
    // 重写toString方法,返回当前对象的字符串表示形式  
    // 通常用于调试或日志记录  
    public String toString() {  
        return "(" + this.data + "," + this.parent + "," + this.left + "," + this.right + ")";  
    }  
  
    // 判断当前节点是否是叶子节点的方法  
    // 在哈夫曼编码中,叶子节点通常代表具体的字符  
    public boolean isLeaf() {  
        // 如果左子节点和右子节点的索引都是-1,则表示这是一个叶子节点  
        return this.left == -1 && this.right == -1;  
    }  
}

在这个类中,TriElement代表哈夫曼树中的一个节点。每个节点都有一个数据字段(通常用于存储字符的频率),以及指向其父节点、左子节点和右子节点的索引。这个类还提供了两个构造方法来创建新的TriElement实例,以及一个toString方法用于返回节点的字符串表示形式,和一个isLeaf方法用于判断节点是否是叶子节点


  
// 这是一个Huffman树类的实现  
public class HuffmanTree {  
  
    // 字符集,这里用A到Z的字符代表,但实际上它只用于索引,真正的字符频率在TriElement的data字段中  
    private String charset;  
  
    // 存储Huffman树节点的数组  
    private TriElement[] element;  
  
    // 构造函数,用于根据字符频率数组构建Huffman树  
    public HuffmanTree(int[] weights) {  
        // 初始化字符集为A到Z,注意这里假设了weights数组的长度就是字符集的大小  
        this.charset = "";  
        int n = weights.length;  
        for (int i = 0; i < weights.length; i++)  
            this.charset += (char) ('A' + i);  
  
        // 初始化节点数组,大小为2n-1(因为每次合并都会增加一个节点)  
        this.element = new TriElement[2 * n - 1];  
  
        // 初始化叶子节点,每个叶子节点对应一个字符频率  
        for (int i = 0; i < n; i++)  
            this.element[i] = new TriElement(weights[i]);  
  
        // 构建Huffman树,通过不断合并频率最小的两个节点  
        for (int i = n; i < 2 * n - 1; i++) {  
            int min1 = Integer.MAX_VALUE, min2 = min1;  
            int x1 = -1, x2 = -1;  
  
            // 找到两个频率最小的节点  
            for (int j = 0; j < i; j++) {  
                if (this.element[j].parent == -1) { // 确保只考虑尚未合并的节点  
                    if (this.element[j].data < min1) {  
                        min2 = min1;  
                        x2 = x1;  
                        min1 = this.element[j].data;  
                        x1 = j;  
                    } else if (this.element[j].data < min2) {  
                        min2 = this.element[j].data;  
                        x2 = j;  
                    }  
                }  
            }  
  
            // 将找到的两个节点设置为新节点的子节点,并创建新节点  
            this.element[x1].parent = i;  
            this.element[x2].parent = i;  
            this.element[i] = new TriElement(min1 + min2, -1, x1, x2);  
        }  
    }  
  
    // 根据节点的索引,生成对应的Huffman编码  
    private String huffmanCode(int i) {  
        // 假设Huffman编码的最大长度为8(这个长度通常是根据实际应用场景设定的)  
        int n = 8;  
        char code[] = new char[n];  
  
        // 从根节点开始,沿着树向下遍历,直到找到叶子节点  
        int child = i, parent = this.element[child].parent;  
        for (int index = n - 1; parent != -1; index--) {  
            // 如果当前节点是父节点的左子节点,则编码为'0',否则为'1'  
            code[index] = (this.element[parent].left == child) ? '0' : '1';  
            child = parent;  
            parent = this.element[child].parent;  
        }  
  
        // 返回从第一个非零字符开始到字符串末尾的子字符串  
        return new String(code, index + 1, n - 1 - index);  
    }  
  
    // 返回Huffman树的字符串表示形式,包括节点数组和每个字符的Huffman编码  
    public String toString() {  
        String str = "Huffman树的节点数组";  
        for (int i = 0; i < this.element.length; i++)  
            str += this.element[i].toString() + "";  
  
        str += "\nHuffman编码:";  
        // 遍历字符集,为每个字符生成Huffman编码并添加到字符串中  
        for (int i = 0; i < this.charset.length(); i++)  
            str += this.charset.charAt(i) + ":" + this.huffmanCode(i) + ",";  
  
        return str;  
    }  
  
   public String encode(String text)  
{  
    String compressed = ""; // 初始化压缩后的字符串为空  
    for(int i = 0; i < text.length(); i++) // 遍历输入文本的每个字符  
    {  
        int j = text.charAt(i) - 'A'; // 假设文本只包含大写字母A-Z,将字符转换为索引  
        compressed += this.huffmanCode(j); // 获取该字符的Huffman编码并添加到压缩字符串中  
    }  
    return compressed; // 返回压缩后的字符串  
}
public String decode(String compressed)  
{  
    String text = ""; // 初始化解码后的文本字符串为空  
    int node = this.element.length - 1; // 从Huffman树的根节点开始  
    for(int i = 0; i < compressed.length(); i++) // 遍历压缩字符串的每个字符  
    {  
        if(compressed.charAt(i) == '0')  
            node = element[node].left; // 如果编码字符是'0',则向左子节点移动  
        else  
            node = element[node].right; // 如果编码字符是'1',则向右子节点移动  
  
        if(element[node].isLeaf()) // 如果当前节点是叶子节点  
        {  
            text += this.charset.charAt(node - this.element.length / 2); // 将叶子节点对应的字符添加到文本中  
            node = this.element.length - 1; // 重置为根节点,准备解码下一个字符  
        }  
    }  
    return text; // 返回解码后的文本字符串  
}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/596909.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

一般显卡3d建模渲染够用吗?3d云渲染助力

3D建模和渲染对计算机硬件有较高要求&#xff0c;特别是显卡。显卡的性能直接影响渲染速度&#xff0c;低端和高端显卡在渲染效率上存在显著差异。对于追求快速渲染的用户&#xff0c;高端显卡是首选。那么&#xff0c;4050显卡是否能够满足3D建模渲染的需求呢?下面我们来探讨…

CSS悬浮动画

<button class"btn">悬浮动画</button>.btn {position: absolute;top: 50%;left: 50%;transform: translate(-50%, -50%);padding: 10px 20px;width: 200px;height: 50px;background-color: transparent;border-radius: 5px;border: 2px solid powderblu…

第78天:WAF攻防-菜刀冰蝎哥斯拉流量通讯特征绕过检测反制感知

目录 案例一&#xff1a; 菜刀-流量&绕过&特征&检测 菜刀的流量特征 案例二&#xff1a;冰蝎-流量&绕过&特征&检测 冰蝎使用教程 冰蝎的流量特征 案例三&#xff1a; 哥斯拉-流量&绕过&特征&检测 哥斯拉使用教程 哥斯拉的流量特征…

二手车买卖求购置换租车微信抖音小程序开源版开发

二手车买卖求购置换租车微信抖音小程序开源版开发 二手车置换平台小程序系统&#xff0c;为买家和卖家提供了一个交流和交易的平台 Uniapp&#xff0c;基于Uniapp开发&#xff0c;仅支持编译微信小程序和抖音小程序 车辆发布&#xff0c;自主发布车辆信息。 圈子交流&#xff…

自动驾驶主流芯片及平台架构(二)特斯拉自动驾驶芯片平台介绍

早期 对外采购mobileye EyeQ3 芯片摄像头半集成方案&#xff0c;主要是为了满足快速量产需求&#xff0c;且受制于研发资金不足限制&#xff1b; 中期 采用高算力NVIDIA 芯片平台其他摄像头供应商的特斯拉内部集成方案&#xff0c;mobileye开发节奏无法紧跟特斯拉需求&#xff…

嵌入式系统应用-拓展-FLASH之操作 SFUD (Serial Flash Universal Driver)之KEIL移植

1 SFUD介绍 1.1 初步介绍 SFUD 是一个开源的串行 SPI 闪存通用驱动库。由于市面上有各种类型的串行闪存设备&#xff0c;每种设备都具有不同的规格和指令&#xff0c;因此 SFUD 的设计目的是解决这些差异。这使得我们的产品可以支持不同品牌和规格的闪存&#xff0c;增强了软…

任意文件读取rce记录

1.跨目录上传 对某系统进行测试时&#xff0c;发现有一处上传附件的功能&#xff0c;常规上传个文件试试 发现返回包返回了重命名后的文件名称和系统的绝对路径 继续看上传的文件 只有一个预览的功能&#xff0c;访问直接下载该文件&#xff0c;并没有什么用&#xff0c;请求链…

Ansible自动化运维工具单模块介绍

前言 自动化运维是指利用自动化工具和技术来简化、自动化和优化IT基础设施的管理和运维过程&#xff0c;从而提高效率、降低成本&#xff0c;并减少人为错误。在当今复杂的IT环境中&#xff0c;自动化运维已经成为许多组织和企业提高生产力和保证系统稳定性的重要手段。Ansibl…

NYU Depth V2数据集相关介绍

一、参考资料 NYU Depth Dataset V2官网 论文&#xff1a;Indoor Segmentation and Support Inference from RGBD Images 二、 相关介绍 1.简介 NYU-Depth V2数据集由来自微软 Kinect 的RGB和深度相机记录的各种室内场景的视频序列组成。它具有&#xff1a; 1449对密集标…

Transformer全流程细致讲解

文章目录 1. Transformer 架构概述2. 编码器&#xff08;Encoder&#xff09;2.1 输入嵌入层&#xff08;Input Embedding Layer&#xff09;2.1.1 一个简单的示例 2.2 位置编码&#xff08;Positional Encoding&#xff09;2.2.1 Transformer中采用的位置编码方式2.2.2 公式中…

个人直播/流媒体服务解决方案实践

目录 1. 说明 1.1 拓扑结构图 2. 准备工作 2.1 软硬件清单 3. 步骤 3.1 按上面的软硬件清单准备好材料 3.2 内网检查测试 3.3 透传到公网服务器 3.5 机顶盒配置 4. 总结 5. 参考 6. 后语 1. 说明 - 在本地局域网建立流媒体服务&#xff0c;并发布到公网服务器供终…

【CTF Web】XCTF GFSJ0482 weak_auth Writeup(弱口令+密码爆破)

weak_auth 小宁写了一个登陆验证页面&#xff0c;随手就设了一个密码。 解法 随便输入一些字符&#xff0c;提示以 admin 登录。 使用 Burp 抓包。 导入密码字典。 进行爆破。 得到密码。 账号&#xff1a;admin 密码&#xff1a;123456取得 flag。 Flag cyberpeace{42c9664…

(论文阅读-多目标优化器)Multi-Objective Parametric Query Optimization

目录 摘要 一、简介 1.1 State-of-the-Art 1.2 贡献和大纲 二、定义 三、相关工作 四、问题分析 4.1 分析 4.2 算法设计影响 五、通用算法 5.1 算法概述 5.2 完备性证明 六、分段线性代价函数算法 6.1 数据结构 6.2 基本运算实现 6.3 复杂度分析 七、实验评估 …

数据库大作业——基于qt开发的图书管理系统(二) 相关表结构的设计

前言 在上一篇文章中。我们完成了Qt环境的安装&#xff0c;同时完成了有关项目需求的分析并绘制了整体的项目架构图&#xff0c;而在图书管理系统中&#xff0c;其实我们主要完成的就是对数据的增删改查&#xff0c;并将这些功能通过信号与槽机制和可视化界面绑定在一起&#…

【菜单下拉效果】基于jquery实现二级菜单下拉效果(附完整源码下载)

Js菜单下拉特效目录 &#x1f354;涉及知识&#x1f964;写在前面实现效果&#x1f367;一、涉及知识&#x1f333;二、具体实现2.1 搭建一级菜单2.2 搭建二级菜单项2.3 引入js文件2.4 构建CSS文件 &#x1f40b;三、源码获取&#x1f305; 作者寄语 &#x1f354;涉及知识 ht…

Xinstall实操指南:二维码推广,轻松追踪App安装效果!

在移动互联网时代&#xff0c;App的推广方式层出不穷&#xff0c;但二维码推广始终占据着重要的地位。作为国内专业的App全渠道统计服务商&#xff0c;Xinstall深知二维码推广的潜力与价值&#xff0c;并致力于通过创新的技术和服务&#xff0c;帮助广告主和开发者实现推广效果…

AtCoder Regular Contest 176(ARC176)A、B

题目&#xff1a;AtCoder Regular Contest 176 - tasks 官方题解&#xff1a;AtCoder Regular Contest 176 - editorial 参考&#xff1a;atcoder regular 176 (ARC176) A、B题解 A - 01 Matrix Again 题意 给一个nn的方格&#xff0c;给出m个坐标(x,y)m&#xff0c;在方格中…

opencv图像处理详细讲

传统的计算机视觉框架&#xff1a; SimpleCV BoofCV Dlib JavaCV 深度学习计算机视觉框架 Caffe Tensorflow Pytorch Paddlepaddle Keras 深度视觉计算机视觉框架 OpenVINO TensorRT onnxruntime Deepface YOLO/DarkNet mmdetection Paddle-detection/seg/ocr …

csrf攻击(跨站请求伪造)【2】

1.DVWA中csrf漏洞验证low &#xff08;1&#xff09;受害者将密码更改为password&#xff0c;显示更改成功 (2)受害者未退出登录状态&#xff0c;打开了新链接(黑客设计好的修改密码为admin123(原本为passwrod)的链接&#xff09;&#xff0c;导致受害者密码被更改&#xff0c…

测试环境搭建:JDK+Tomcat+Mysql+Redis

基础的测试环境搭建&#xff1a; LAMPLinux(CentOS、ubuntu、redhat)ApacheMysqlPHP LTMJLinux(CentOS、ubuntu、redhat)TomcatMysql(Oracle)RedisJava 真实的测试环境搭建&#xff1a;&#xff08;企业真实的运维&#xff09; 基于SpringBoot&#xff08;SpringCloud分布式微…
最新文章