树结构，二叉树，hash树

2023-11-14

1，树的概念

1、树的特性

1）一棵树中的任意两个结点有且仅有唯一的一条路径连通；
2）一棵树如果有n个结点，则它一定有n−1条边；
3）在一棵树中加一条边将会构成一个回路。

2、二叉树

1）二叉树是一种特殊的树，二叉树的特点是每个结点最多有两个儿子。
2）二叉树使用范围最广，一颗多叉树也可以转化为二叉树。

3、满二叉树

1）二叉树中每个内部节点都有两个儿子，满二叉树所有的叶节点都有相同的深度。
2）满二叉树是一棵深度为h且有2h−1个结点的二叉树。

4、完全二叉树

1）若设二叉树的高度为h，除了第h层外，其他层的结点数都达到最大个数，第h层从右向左连续缺若干个结点，则为完全二叉树。

在这里插入图片描述

5、树的特点

如果一棵完全二叉树的父节点编号为K,则其左儿子的编号是2K,右儿子的结点编号为2K+1

已知完全二叉树的总节点数为n求叶子节点个数：

已知完全二叉树的总节点数为n求父节点个数：为：n/2

已知完全二叉树的总节点数为n求叶子节点为2的父节点个数：
　　　　　　　　当n为奇数时：n/2
　　　　　　　　当n为偶数时 : n/2-1
5.如果一棵完全二叉树有N个结点，那么这棵二叉树的深度为【log2（N+1）log2（N+1）】（向上取整）

2，二叉树基本操作

参考博客：https://www.cnblogs.com/freeman818/p/7252041.html
1、生成树结构

前序遍历： DBACEGF（根节点排最先，然后同级先左后右）

中序遍历： ABCDEFG (先左后根最后右）

后序遍历： ACBFGED （先左后右最后根）

生成树形结构

class Node:
    def __init__(self,value=None,left=None,right=None):
        self.value=value
        self.left=left    #左子树
        self.right=right  #右子树

if __name__=='__main__':
    root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))

前序遍历

class Node:
    def __init__(self,value=None,left=None,right=None):
        self.value=value
        self.left=left    #左子树
        self.right=right  #右子树

def preTraverse(root):
     '''
     前序遍历
     '''
     if root==None:
         return
     print(root.value)
     preTraverse(root.left)
     preTraverse(root.right)

if __name__=='__main__':
    root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))
    print('前序遍历：')
    preTraverse(root)   #  DBACEGF

中序遍历

class Node:
    def __init__(self,value=None,left=None,right=None):
        self.value=value
        self.left=left    #左子树
        self.right=right  #右子树

def midTraverse(root):
    '''
    中序遍历
    '''
    if root == None:
        return
    midTraverse(root.left)
    print(root.value)
    midTraverse(root.right)

if __name__=='__main__':
    root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))
    print('中序遍历：')
    midTraverse(root)   #  ACBFGED

后序遍历

class Node:
    def __init__(self,value=None,left=None,right=None):
        self.value=value
        self.left=left    #左子树
        self.right=right  #右子树

def afterTraverse(root):
    '''
    后序遍历
    '''
    if root == None:
        return
    afterTraverse(root.left)
    afterTraverse(root.right)
    print(root.value)

if __name__=='__main__':
    root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))
    print('后序遍历：')
    afterTraverse(root)   #  ACBFGED

在这里插入图片描述

前序遍历步骤推演

前序排列原理：
#####此时执行preTraverse(root.left) 函数
'''
1、第一步 root=Node(D) print D，D入栈[D]
2、第二步 root=Node(D).left=Node(B) print B, B入栈[D,B]
3、第三步 root=Node(B).left=Node(A) print A, A入栈[D,B,A]
4、第四步 root=Node(A).left=None,没有进入递归，顺序执行preTraverse(root.right)
5、第五步 Node(A).right==None，也没有进入递归，此时preTraverse(A) 函数才会正真返回，A出栈[D,B]
6、第六步 A的上级调用函数为：preTraverse(B.left),所以接着会顺序执行preTraverse(B.right),B的左右节点访问后B出栈[D]
7、第七步 Node(B).right==Node(C) print C,C入栈[D,C]
8、第八步 Node(C).left==None, Node(C).right==None,访问完C的左右节点后函数返回C出栈，返回上级调用[D]
9、第九步 此时返回上级调用执行preTraverse(D.right)=Node(E) print E,D出栈，E入栈[E] 
'''

'''此时输出结果：DBACE'''

分层打印二叉树

class Node:
    def __init__(self,value=None,left=None,right=None):
        self.value=value
        self.left=left    #左子树
        self.right=right  #右子树

def layered_print( root):
    if not root:
        return []
    curLayer = [root]                           # 当前层的所有节点
    while curLayer:
        layerValue = []                         # 当前层的值
        nextLayer = []                          # 下一层的所有节点
        for node in curLayer:                   # 循环当前层所有节点并并获取所有value值
            layerValue.append(node.value)
            if node.left:
                nextLayer.append(node.left)        # 将当前层的左节点加入列表
            if node.right:
                nextLayer.append(node.right)        # 将当前层的右节点加入列表
                
        print layerValue                           # 打印当前层的值
        curLayer = nextLayer                      # 将循环下移一层


'''
['D']
['B', 'E']
['A', 'C', 'G']
['F']
'''

if __name__=='__main__':
    root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))
    layered_print(root)

3，hash树

1、hash树描述（就是散列树）

散列树选择从2开始的连续质数来建立一个十层的哈希树。

第一层结点为根结点，根结点下有2个结点；

第二层的每个结点下有3个结点；

依此类推，即每层结点的子节点数目为连续的质数。

2、hash树特点

注：关系型数据库中，索引大多采用B/B+树来作为存储结构，而全文搜索引擎的索引则主要采用hash的存储结构，这两种数据结构有什么区别？

如果是等值查询，那么哈希索引明显有绝对优势，因为只需要经过一次算法即可找到相应的键值；

当然了，这个前提是，键值都是唯一的，如果键值不是唯一的，就需要先找到该键所在位置，然后再根据链表往后扫描，直到找到相应的数据；

如果是范围查询检索，这时候哈希索引就毫无用武之地了，因为原先是有序的键值，经过哈希算法后，有可能变成不连续的了，就没办法再利用索引完成范围查询检索；

同理，哈希索引也没办法利用索引完成排序，以及like ‘xxx%’ 这样的部分模糊查询（这种部分模糊查询，其实本质上也是范围查询）；

3、建立hash树

选择从2开始的连续质数来建立一个十层的哈希树。

第一层结点为根结点，根结点下有2个结点；第二层的每个结点下有3个结点；

依此类推，即每层结点的子节点数目为连续的质数。到第十层，每个结点下有29个结点。

同一结点中的子结点，从左到右代表不同的余数结果。
例如：第二层结点下有三个子节点。那么从左到右分别代表：除3余0，除3余1，除3余2.对质数进行取余操作得到的余数决定了处理的路径。

以随机的10个数的插入为例，来图解HashTree的插入过程。

其实也可以把所有的键-值节点放在哈希树的第10层叶节点处，这第10层的满节点数就包含了所有的整数个数，
但是如果这样处理的话，所有的非叶子节点作为键-值节点的索引，这样使树结构庞大，浪费空间。

在这里插入图片描述

4、查找编辑

哈希树的节点查找过程和节点插入过程类似，就是对关键字用质数序列取余，根据余数确定下一节点的分叉路径，直到找到目标节点。

如上图，最小”哈希树(HashTree)在从4G个对象中找出所匹配的对象，比较次数不超过10次，也就是说：最多属于O(10)。

在实际应用中，调整了质数的范围，使得比较次数一般不超过5次。

也就是说：最多属于O(5)，因此可以根据自身需要在时间和空间上寻求一个平衡点。

5、删除编辑

哈希树的节点删除过程也很简单，哈希树在删除的时候，并不做任何结构调整。

只是先查到到要删除的节点，然后把此节点的“占位标记”置为false即可（即表示此节点为空节点，但并不进行物理删除）。

6、hash树优点

1）结构简单

从哈希树的结构来说，非常的简单，每层节点的子节点个数为连续的质数。

子节点可以随时创建，因此哈希树的结构是动态的，也不像某些哈希算法那样需要长时间的初始化过程。

哈希树也没有必要为不存在的关键字提前分配空间。

2）查找迅速

从算法过程我们可以看出，对于整数，哈希树层级最多能增加到10。

因此最多只需要十次取余和比较操作，就可以知道这个对象是否存在，这个在算法逻辑上决定了哈希树的优越性。

3）结构不变

从删除算法中可以看出，哈希树在删除的时候，并不做任何结构调整。

常规树结构在增加元素和删除元素的时候都要做一定的结构调整，否则他们将可能退化为链表结构，而导致查找效率的降低。

哈希树采取的是一种“见缝插针”的算法，从来不用担心退化的问题，也不必为优化结构而采取额外的操作，因此大大节约了操作时间。

7、缺点编辑

哈希树不支持排序，没有顺序特性。

如果在此基础上不做任何改进的话并试图通过遍历来实现排序，那么操作效率将远远低于其他类型的数据结构。

8、hash索引使用范围

总结：哈希适用在小范围的精确查找，在列数据很大，又不需要排序，不需要模糊查询，范围查询时有用
1、hash索引仅满足“=”、“IN”和“<=>”查询，不能使用范围查询
因为hash索引比较的是经常hash运算之后的hash值，因此只能进行等值的过滤，不能基于范围的查找，
因为经过hash算法处理后的hash值的大小关系，并不能保证与处理前的hash大小关系对应。
2、hash索引无法被用来进行数据的排序操作
由于hash索引中存放的都是经过hash计算之后的值，而hash值的大小关系不一定与hash计算之前的值一样，
所以数据库无法利用hash索引中的值进行排序操作。
3、对于组合索引，Hash 索引在计算 Hash 值的时候是组合索引键合并后再一起计算 Hash 值，
而不是单独计算 Hash 值，所以通过组合索引的前面一个或几个索引键进行查询的时候，Hash 索引也无法被利用。
4、Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。
对于选择性比较低的索引键，如果创建 Hash 索引，那么将会存在大量记录指针信息存于同一个 Hash 值相关联。
这样要定位某一条记录时就会非常麻烦，会浪费多次表数据的访问，而造成整体性能低下。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据结构

python基础

python

树结构，二叉树，hash树的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar

随机推荐

Spring和mybatis整合

一 Spring整合MyBatis 1 导入pom依赖 1 1 添加spring相关依赖 5 0 2 RELEASE spring core spring beans spring context spring orm spring tx
管好【SD-WEBUI】中大量的模型：名称+预览图+备注+分组管理

文章目录零前言一模型管理 1 1 模型名称文件名 1 2 模型缩略图 1 3 模型备注文字 1 4 模型分组子目录 1 5 模型详细信息二第二部分三第三部分零前言本篇主要讲怎么管理大量的模型比如模型不要大幅改名
使用Struts2的JSON插件来实现JSON数据传递

想要实现此功能第一步需要Struts2的核心架包第二步需要struts2 json plugin 2 3 30架包在lib文件夹下可以找到还是借用上次的笔记来继续写这个时候我们就不需要用到Servlet了要使用到Action 配
自学python入门要买什么书？

文章目录 1 Python编程从入门到实践 2 Python编程快速上手让繁琐工作自动化 3 Python基础教程第3版 4 Python核心编程第3版 5 Python 3网络爬虫开发实战 6 Python神经网络编程自学pyt
g++编译详解

g 编译详解资料准备为了方便演示和讲解在这里提前准备好几个简单的文件 test cpp test h main cpp 文件内容如下 main cpp include test h int main int argc char arg
华为OD机试 - 组装新的数组（Java）

题目描述给你一个整数M和数组N N中的元素为连续整数要求根据N中的元素组装成新的数组R 组装规则 R中元素总和加起来等于M R中的元素可以从N中重复选取 R中的元素最多只能有1个不在N中且比N中的数字都要小不能为负数输入描述第一
php常用插件

初衷以下总结了一些开发中发现以及用到的比较好用的扩展会不断地进行更新如果有好的扩展推荐也可以留言我会及时补充上方便自己和大家使用更新说明 2019年11月11日更新添加 php 文件加密扩展 2019年10月28日更新添加
联邦EMNIST数据集 (FEMNIST)

文章目录 Introduction NIST Special Database 19 Modified NIST MNIST Extended MNIST EMNIST Federated Extended MNIST FEMNIST fe
输入的不是有效的 Base-64 字符串，因为它包含非 Base-64 字符、两个以上的填充字符，或者填充字符间包含非法字符。

消息 6522 级别 16 状态 2 第 2 行在执行用户定义例程或聚合 AESDecrypt 期间出现 NET Framework 错误 System FormatException 输入的不是有效的 Base 64 字符串因为它包含
多方安全计算-隐私信息检索(PIR)

隐私信息检索 Private Information Retrieval PIR 技术是由Chor B等提出解决保护用户查询隐私的方案主要目的是保证查询用户在向服务器上的数据库提交查询请求在用户查询隐私信息不被泄漏的条件下完成查询即
Java之缓冲流、转换流、节点流、包装流

文章目录一 BufferedRead 带有缓冲的字符输入流 1 节点流和包装流 2 readline 读一行字符二转换流 InputStreamReader与OutputStreamWriter 三 BufferedWrite 带有缓
编译原理实验二：Bison

编译原理实验二 Bison 实验要求 1 了解Bision基础知识如何将文法产生式转换为Bison语句 2 阅读 src common SyntaxTree c 对应头文件 include SyntaxTree h 理解分析树生成的过程
你对C++头文件了解多少？——盘点C++的常用头文件

相信大家在编写C C 程序时最必不可少的部分之一就是头文件了然而由于不同的函数所对应的头文件各不相同就导致一部分人尤其是我写代码的时候常常遇到忘记所需头文件的窘境为了解决这个问题今天我特意搜集了C 中常用的头文件及其包含的库
FICO F.27 Customer statement 打印

需求定制化打印替换标准的F 27打印类似于采购订单的打印但是略有不同查阅资料之后步骤如下 T code F 27 is SAP standard program to produce customer vendor corresp
数据结构简述，时间、空间复杂度，学习网站推荐

目录 IT 学习路线相关坚韧大厚书相关有趣耐看书或视频数据结构与算法学习网站推荐刷题时间空间复杂度数据结构简述基本概念数据结构与算法简述和CS综述整理本文非基础的教程本文会列出大量学习和参考网站老惯例一个文章是一
2022 PostgreSQL 数据库生态大会：拓数派资深工程师王淏舟将发表主题演讲

由中国开源软件推进联盟PostgreSQL分会中科院软件所 CSDN联合举办的中国PostgreSQL数据库生态大会将于2月17 19日召开本届大会以协同共进为主题邀请专家学者厂商和用户代表就PostgreSQL在行业和区
Vue3开发教程（一、学习Vue前需要了解的内容)

前言本文是笔者学习vue前端技术过程的总结其中包括vue开发需要了解的相关技术如 node ES6 TypeScript vite ElementUI 以vue作为主线来介绍相关技术最后通过一个典型的前端应用来体会vue的开发希望笔
最长子序列 JAVA 2019国赛试题F

试题 F 最长子序列时间限制 1 0s 内存限制 512 0MB 本题总分 15 分问题描述我们称一个字符串 S 包含字符串 T 是指 T 是 S 的一个子序列即可以从字符串 S 中抽出若干个字符它们按原来的顺序组合成一个新的字
[SQL]yyyymmdd类型与yyyy-mm-dd日期类型的相互转换

法1 from unixtime unix timestamp 20171205转成2017 12 05 select from unixtime unix timestamp 20171205 yyyymmdd yyyy mm dd fr
树结构，二叉树，hash树

目录 1 树的概念 2 二叉树基本操作 3 hash树 1 树的概念 1 树的特性 1 一棵树中的任意两个结点有且仅有唯一的一条路径连通 2 一棵树如果有n个结点则它一定有n 1条边 3 在一棵树中加一条边将会构成一个回路 2 二叉树 1

树结构，二叉树，hash树

目录

1，树的概念

2，二叉树基本操作

3，hash树

树结构，二叉树，hash树 的相关文章

随机推荐

热门标签

树结构，二叉树，hash树的相关文章