如何创建用于霍夫曼编码和解码的树？

2024-05-19

对于我的作业，我将对霍夫曼树进行编码和解码。我在创建树时遇到问题，并且陷入困境。

不要介意打印语句 - 它们只是让我测试并查看函数运行时的输出是什么。

对于第一个 for 循环，我从主块中用于测试的文本文件中获取了所有值和索引。

在第二个 for 循环中，我将所有内容插入优先级队列中。

我对下一步该去哪里感到非常困惑 - 我正在尝试创建节点，但我对如何进展感到困惑。有人可以告诉我我这样做是否正确？

def _create_code(self, frequencies):
    '''(HuffmanCoder, sequence(int)) -> NoneType
    iterate over index into the sequence keeping it 256 elements long, '''
    #fix docstring
    p = PriorityQueue()
    print frequencies

    index = 0 
    for value in frequencies:
        if value != 0:
            print value #priority
            print index #elm
            print '-----------'       
        index = index + 1


    for i in range(len(frequencies)):
        if frequencies[i] != 0:
            p.insert(i, frequencies[i])  
            print i,frequencies[i]
            if p.is_empty():
                a = p.get_min()
                b = p.get_min()
                n1 = self.HuffmanNode(None, None, a)
                n2 = self.HuffmanNode(None, None, b)
                print a, b, n1, n2
    while not p.is_empty():
        p.get_min()

我手动插入前两个来启动我的树，对吗？

我该如何继续？我知道它的想法，只是代码方面我很困难。

顺便说一句，这是使用Python。我尝试查看维基百科，我知道步骤，我只需要代码方面的帮助以及我应该如何继续，谢谢！

HuffmanNode 来自这个嵌套类：

class HuffmanNode(object):

    def __init__(self, left=None, right=None, root=None):
        self.left = left
        self.right = right
        self.root = root

维基百科中的霍夫曼算法准确地告诉您如何创建节点树，因此您的程序可以基于该算法或其他类似算法。这是一个带有注释的 Python 程序，显示了相应的维基百科算法步骤。测试数据是英文文本中字母表字母的频率。

创建节点树后，您需要遍历它以将霍夫曼代码分配给数据集中的每个符号。由于这是家庭作业，因此这一步取决于您，但递归算法是处理它的最简单、最自然的方法。只剩下六行代码了。

import queue

class HuffmanNode(object):
    def __init__(self, left=None, right=None, root=None):
        self.left = left
        self.right = right
        self.root = root     # Why?  Not needed for anything.
    def children(self):
        return((self.left, self.right))

freq = [
    (8.167, 'a'), (1.492, 'b'), (2.782, 'c'), (4.253, 'd'),
    (12.702, 'e'),(2.228, 'f'), (2.015, 'g'), (6.094, 'h'),
    (6.966, 'i'), (0.153, 'j'), (0.747, 'k'), (4.025, 'l'),
    (2.406, 'm'), (6.749, 'n'), (7.507, 'o'), (1.929, 'p'), 
    (0.095, 'q'), (5.987, 'r'), (6.327, 's'), (9.056, 't'), 
    (2.758, 'u'), (1.037, 'v'), (2.365, 'w'), (0.150, 'x'),
    (1.974, 'y'), (0.074, 'z') ]

def create_tree(frequencies):
    p = queue.PriorityQueue()
    for value in frequencies:    # 1. Create a leaf node for each symbol
        p.put(value)             #    and add it to the priority queue
    while p.qsize() > 1:         # 2. While there is more than one node
        l, r = p.get(), p.get()  # 2a. remove two highest nodes
        node = HuffmanNode(l, r) # 2b. create internal node with children
        p.put((l[0]+r[0], node)) # 2c. add new node to queue      
    return p.get()               # 3. tree is complete - return root node

node = create_tree(freq)
print(node)

# Recursively walk the tree down to the leaves,
#   assigning a code value to each symbol
def walk_tree(node, prefix="", code={}):
    return(code)

code = walk_tree(node)
for i in sorted(freq, reverse=True):
    print(i[1], '{:6.2f}'.format(i[0]), code[i[1]])

当对字母表数据运行时，生成的霍夫曼代码为：

e  12.70 100
t   9.06 000
a   8.17 1110
o   7.51 1101
i   6.97 1011
n   6.75 1010
s   6.33 0111
h   6.09 0110
r   5.99 0101
d   4.25 11111
l   4.03 11110
c   2.78 01001
u   2.76 01000
m   2.41 00111
w   2.37 00110
f   2.23 00100
g   2.02 110011
y   1.97 110010
p   1.93 110001
b   1.49 110000
v   1.04 001010
k   0.75 0010111
j   0.15 001011011
x   0.15 001011010
q   0.10 001011001
z   0.07 001011000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Tree

encode

huffmancode

如何创建用于霍夫曼编码和解码的树？的相关文章

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表所以我希望输出看起来像这样 Database Table name Database1 Table 1 Database1 Table 2 Database1 Table
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

如何使用 Fluent NHibernate 自动映射来映射字典？

我有一个像这样的实体 public class Land public virtual IDictionary
将签名位图转换为签名字符串（很奇怪的一个）

基本上我需要将位图图像转换为字符串但这不是常见的困境在于该字符串由两部分组成 1 积分 2 线路我需要将图像转换为由分隔的两个部分我得到的一个例子是 221A 221A270A270A25032503200720071716171
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
OpenGL：仅获取模板缓冲区而没有深度缓冲区？

我想获取一个模板缓冲区但如果可能的话不要承受附加深度缓冲区的开销因为我不会使用它我发现的大多数资源表明虽然模板缓冲区是可选的例如排除它以利于获得更高的深度缓冲区精度但我还没有看到任何请求并成功获取仅 8 位模板缓冲区的代码
我可以在 XSLT 中创建模板吗？

我想使用 XSLT 从 XML 创建 ASP NET 用户控件目前我真的把结果一点一点地拼凑起来
使用用户定义函数 MySql 时出错

您好请帮我解决这个问题提前致谢我在数据库中定义了这些函数 CREATE FUNCTION levenshtein s1 VARCHAR 255 s2 VARCHAR 255 RETURNS INT DETERMINISTIC BEGI
将数组作为参数传递

如果我们修改作为方法内参数传递的数组的内容则修改是在参数的副本而不是原始参数上完成的因此结果不可见当我们调用具有引用类型参数的方法时会发生什么过程这是我想问的代码示例 using System namespace Value Re
将2-3-4树转换为红黑树

我正在尝试将 2 3 4 树转换为 java 中的红黑树但我无法弄清楚它我将这两个基本类编写如下以使问题简单明了但不知道从这里到哪里去 public class TwoThreeFour
下载中带有文件名的 NodeJS sendFile

我尝试使用以下代码将文件发送给客户端 router get get myfile function req res next res sendFile other file name dat 它工作正常但当用户从以下网址下载此文件时我需要
无法连接到 MAMP 上的 phpMyAdmin

我收到此错误消息 MySQL 说道无法连接设置无效 phpMyAdmin 尝试连接 MySQL 服务器但服务器拒绝连接您应该检查配置中的主机用户名和密码并确保它们与 MySQL 服务器管理员提供的信息相对应用户和通行证是默认的
VSCode TypeScript 问题Matcher `$tsc-watch` 未观看

我试图避免使用watch true in a tsconfig json配置通过 VSCode 的任务我正在使用基本问题匹配器 tsc watch但它没有启动tsc构建时处于监视模式我正在添加gulp支持我看到有gulp watch
实体框架中的“it”是什么

如果以前有人问过这个问题请原谅我但我的任何搜索中都没有出现它我有两个数据库表 Person 和 Employee 对每个类型的表进行建模例如 Employee is a Person 在我的 edmx 设计器中我定义了一个实体
为 TFliteconverter 创建代表性数据集的正确方法是什么？

我正在尝试推断tinyYOLO V2 with INT8权重和激活我可以使用 TFliteConverter 将权重转换为 INT8 为了INT8激活我必须提供代表性数据集来估计缩放因子我创建此类数据集的方法似乎是错误的正确的程序是
弹出窗口的动态高度取决于内容，可能吗？

是否有可能获得一个宽度始终为 400px 的弹出窗口但根据弹出窗口中的内容动态高度我已经看到了这个但不知道如何将其应用到弹出窗口调整 iframe 的宽度高度以适应其中的内容 https stackoverflow com ques
在 Windows Phone silverlight 8.1 上接收 WNS 推送通知

我有 Windows Phone 8 1 silverlight 应用程序我想使用新框架 WNS 接收通知我在 package appxmanifest 中有
（wxMaxima：表达式幂的文本

我用过texput设置tex1的输出log x to be ln x with texput log lambda e a args e printf false ln a tex1 a 我想知道是否也可以设置类似的输出 log x n 我
有没有办法限制只允许来自其他 App Engine 服务的传入请求？

我有四个服务在 App Engine 上的同一个应用程序中运行我有一个前端 SvelteKit 应用程序和三个后端服务如果可能的话我想以这样的方式设置安全性即后端服务只接受来自前端应用程序的 HTTP 请求前端应用程序通过其节点服
如何在超级测试中模拟中间件？

我想测试中间件是否在app js叫做虽然我嘲笑该模块work js 它仍然运行原始代码 app js const work require work const express require require const app expr
调用 MobileFirst Adapter 授权失败

不确定以前是否曾提出过同样的问题我尝试发表评论但无法这样做请参阅下面的链接不管怎样我刚刚将开发环境升级到 MobileFirst Studio 7 1 但我们在 7 0 中创建的适配器存在问题适配器部署没有错误但是当我尝试从浏览
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循

如何创建用于霍夫曼编码和解码的树？

如何创建用于霍夫曼编码和解码的树？ 的相关文章

随机推荐

热门标签

如何创建用于霍夫曼编码和解码的树？的相关文章