【基础知识】什么是哈希冲突?

2023-10-27

1. 什么是哈希表

哈希表(Hash Table)是一种数据结构,它可以快速地在大量数据中查找、插入和删除时数据。哈希表通过使用哈希函数将键(Key)映射到一个位置,然后在该位置存储或查找数据。

哈希函数的作用是,将键转换为一个整数,这个整数通常称为哈希值(Hash Value)。哈希表的范围通常与哈希表的大小相同。当我们插入或查找数据时,首先计算键的哈希值,然后根据哈希值在哈希表中定位数据。

这里有一个简单的例子来说明哈希表的工作原理:
    假设我们有一个哈希表,大小为5,哈希函数为key mod 5。现在我们要插入键值分别为1、3、8和11的数据。
    首先,我们计算每个键的哈希值:1 mod 5 = 1,3 mod 5 = 3,8 mod 5 = 3,11 mod 5 = 1。然后,我们根据哈希值在哈希表中定位数据。键值为1和11的数据被映射到哈希表的第2个位置(下标从0开始),键值为3和8的数据被映射到哈希表的第4个位置。
    由于键值为1和11被映射到同一个位置,因此发生了哈希冲突。此时,我们可以采用链地址法来解决冲突,在第2个位置建立一个链表,将这两个数据依次存储在链表中。


最终,哈希表中的数据存储情况如下:
```
0: 空
1: [1] -> [11]
2: 空
3: [3] -> [8]
4: 空
```


    当我们查找键值为8的数据时,首先计算它的哈希值:8 mod 5 = 3。然后根据哈希值在哈希表中定位数据,在第4个位置找到了一个链表。最后,在链表中查找键值为8的数据,并返回结果。

由于不同的键可能被映射到同一个位置,因此需要采取一些措施来解决哈希冲突。

2. 什么是哈希冲突

哈希冲突(Hash Collision)是指在使用哈希表存储数据时,两个或多个不同的键(Key)被哈希函数映射到同一个位置的情况。这种情况会导致数据的存储和查找变得复杂,因此需要采取一些措施来解决哈希冲突。

3. 解决哈希冲突的方法

1、开放地址法(Open Addressing)

是一种解决哈希冲突的方法,它的基本思想是,当发生哈希冲突时,按照某种规则寻找下一个空闲的位置来存储数据。

常用的开放地址法有线性探测法、二次探测法和双重哈希法。

(1)线性探测法

是指当发生哈希冲突时,从当前位置开始,依次向后查找下一个空闲的位置,或查遍全表。

例如:
    假设我们有一个哈希表,大小为5,哈希函数为key mod 5。当我们插入键值为1、6和11的数据时,它们都会被映射到哈希表的第2个位置(1 mod 5 = 6 mod 5 = 11 mod 5 = 1)。此时,我们可以采用线性探测法来解决冲突。
    首先将键值为1的数据存储在第2个位置,然后从第2个位置开始,依次向后查找下一个空闲的位置。最终,我们找到了第3个位置,并将键值为6的数据存储在那里。同样地,我们再次从第2个位置开始查找,并在第4个位置找到了一个空闲的位置,将键值为11的数据存储在那里。


''
0: 空
1: [1]
2: [6]
3: [11]
4: 空
''

使用线性探测法解决哈希冲突时,查找、插入和删除操作的时间复杂度与哈希表的装载因子成正比。因此,在设计哈希表时,应尽量选择合适的哈希函数和哈希表大小,并合理控制装载因子,以减少冲突的发生。

(2)二次探测法

是指当发生哈希冲突时,从当前位置开始,按照二次函数的规律查找下一个空闲的位置。

这里有一个简单的例子来说明二次探测法的工作原理。
    假设我们有一个哈希表,大小为5,哈希函数为key mod 5。现在我们要插入键值分别为1、3、8和11的数据。我们采用二次探测法来解决哈希冲突。
    首先,我们计算每个键的哈希值:1 mod 5 = 1,3 mod 5 = 3,8 mod 5 = 3,11 mod 5 = 1。然后,我们根据哈希值在哈希表中定位数据。键值为1和11的数据被映射到哈希表的第2个位置(下标从0开始),键值为3和8的数据被映射到哈希表的第4个位置。
    由于键值为1和11被映射到同一个位置,因此发生了哈希冲突。此时,我们可以采用二次探测法来解决冲突,从第2个位置开始,按照二次函数的规律查找下一个空闲的位置。最终,我们找到了第4个位置,并将键值为11的数据存储在那里。
    同样地,由于键值为3和8被映射到同一个位置,因此也发生了哈希冲突。我们采用同样的方法解决冲突,从第4个位置开始,按照二次函数的规律查找下一个空闲的位置。最终,我们找到了第0个位置,并将键值为8的数据存储在那里。

最终,哈希表中的数据存储情况如下:
```
0: [8]
1: [1]
2: 空
3: [3]
4: [11]
```


    当我们查找键值为8的数据时,首先计算它的哈希值:8 mod 5 = 3。然后根据哈希值在哈希表中定位数据,在第4个位置发现没有数据。此时,我们按照二次探测法的规则继续查找,并在第0个位置找到了键值为8的数据。

使用二次探测法解决哈希冲突时,查找、插入和删除操作的时间复杂度与哈希表的装载因子成正比。因此,在设计哈希表时,应尽量选择合适的哈希函数和哈希表大小,并合理控制装载因子,以减少冲突的发生。

(3)双重哈希法

是指当发生哈希冲突时,使用另一个哈希函数计算出下一个空闲的位置。

这里有一个简单的例子来说明双重哈希法的工作原理。
    假设我们有一个哈希表,大小为5,第一个哈希函数为h1(key) = key mod 5,第二个哈希函数为h2(key) = 3 - (key mod 3)。现在我们要插入键值分别为1、3、8和11的数据。我们采用双重哈希法来解决哈希冲突。    首先,我们计算每个键的哈希值:h1(1) = 1 mod 5 = 1,h1(3) = 3 mod 5 = 3,h1(8) = 8 mod 5 = 3,h1(11) = 11 mod 5 = 1。然后,我们根据哈希值在哈希表中定位数据。键值为1和11的数据被映射到哈希表的第2个位置(下标从0开始),键值为3和8的数据被映射到哈希表的第4个位置。
    由于键值为1和11被映射到同一个位置,因此发生了哈希冲突。此时,我们可以采用双重哈希法来解决冲突,使用第二个哈希函数计算出下一个空闲的位置:(1 + h2(11)) mod 5 = (1 + (3 - (11 mod 3))) mod 5 = (1 + (3 - 2)) mod 5 = (2) mod 5 = 2。最终,我们找到了第3个位置,并将键值为11的数据存储在那里。
    同样地,由于键值为3和8被映射到同一个位置,因此也发生了哈希冲突。我们采用同样的方法解决冲突,使用第二个哈希函数计算出下一个空闲的位置:(3 + h2(8)) mod 5 = (3 + (3 - (8 mod 3))) mod 5 = (6) mod 5 = 1。由于第2个位置已经被占用,因此我们继续计算下一个空闲的位置:(3 + h2(8) * h2(8)) mod 5 = (9) mod 5 =4。最终,我们找到了第0个位置,并将键值为8的数据存储在那里。

最终,哈希表中的数据存储情况如下:
```
0: [8]
1: [1]
2: [11]
3: [3]
4: 空
```

当我们查找键值为8的数据时,首先计算它的哈希值:h1(8) = 8 mod

2、链地址法

链地址法是一种处理哈希冲突的方法,它是将所有散列到同一个地址的数据项存储在一个单链表中。这样,当查找某个数据项时,只需要在对应的链表中进行搜索即可。例如,HashMap 在解决存储对象存在 hash 冲突的问题时,采用的就是链地址法,将相同 hash 值的对象以链表的形式进行存储。

3、再哈希法

在发生冲突的时候,再用另一个哈希函数算出哈希值,直到算出的哈希值不同为止。

4、建立公共溢出区

在创建哈希表的同时,再额外创建一个公共溢出区,专门用来存放发生哈希冲突的元素。查找时,先从哈希表查,查不到再去公共溢出区查。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【基础知识】什么是哈希冲突? 的相关文章

  • WPF DataGrid 多选

    我读过几篇关于这个主题的文章 但很多都是来自 VS 或框架的早期版本 我想做的是从 dataGrid 中选择多行并将这些行返回到绑定的可观察集合中 我尝试创建一个属性 类型 并将其添加到可观察集合中 它适用于单个记录 但代码永远不会触发多个
  • C# 异步等待澄清?

    我读了here http blog stephencleary com 2012 02 async and await html that 等待检查等待的看看它是否有already完全的 如果 可等待已经完成 那么该方法将继续 运行 同步
  • 没有特殊字符的密码验证器

    我是 RegEx 的新手 已经进行了大量搜索 但没有找到任何具体内容 我正在编写一个验证密码字符串的正则表达式 可接受的字符串必须至少具有 4 种字符类型中的 3 种 数字 小写字母 大写字母 特殊字符 我对包含有一个想法 也就是说 如果这
  • 如何在 C# 中打开 Internet Explorer 属性窗口

    我正在开发一个 Windows 应用程序 我必须向用户提供一种通过打开 IE 设置窗口来更改代理设置的方法 Google Chrome 使用相同的方法 当您尝试更改 Chrome 中的代理设置时 它将打开 Internet Explorer
  • free 和 malloc 在 C 中如何工作?

    我试图弄清楚如果我尝试 从中间 释放指针会发生什么 例如 看下面的代码 char ptr char malloc 10 sizeof char for char i 0 i lt 10 i ptr i i 10 ptr ptr ptr pt
  • 如何从本机 C(++) DLL 调用 .NET (C#) 代码?

    我有一个 C app exe 和一个 C my dll my dll NET 项目链接到本机 C DLL mynat dll 外部 C DLL 接口 并且从 C 调用 C DLL 可以正常工作 通过使用 DllImport mynat dl
  • 用于 FTP 的文件系统观察器

    我怎样才能实现FileSystemWatcherFTP 位置 在 C 中 这个想法是 每当 FTP 位置添加任何内容时 我都希望将其复制到我的本地计算机 任何想法都会有所帮助 这是我之前问题的后续使用 NET 进行选择性 FTP 下载 ht
  • 人脸 API DetectAsync 错误

    我想创建一个简单的程序来使用 Microsoft Azure Face API 和 Visual Studio 2015 检测人脸 遵循 https social technet microsoft com wiki contents ar
  • 在 Unity 中实现 Fur with Shells 技术

    我正在尝试在 Unity 中实现皮毛贝壳技术 http developer download nvidia com SDK 10 5 direct3d Source Fur doc FurShellsAndFins pdf Fins 技术被
  • 使用 C# 中的 CsvHelper 将不同文化的 csv 解析为十进制

    C 中 CsvHelper 解析小数的问题 我创建了一个从 byte 而不是文件获取 csv 文件的类 并且它工作正常 public static List
  • LINQ:使用 INNER JOIN、Group 和 SUM

    我正在尝试使用 LINQ 执行以下 SQL 最接近的是执行交叉联接和总和计算 我知道必须有更好的方法来编写它 所以我向堆栈团队寻求帮助 SELECT T1 Column1 T1 Column2 SUM T3 Column1 AS Amoun
  • C 函数 time() 如何处理秒的小数部分?

    The time 函数将返回自 1970 年以来的秒数 我想知道它如何对返回的秒数进行舍入 例如 对于100 4s 它会返回100还是101 有明确的定义吗 ISO C标准没有说太多 它只说time 回报 该实现对当前日历时间的最佳近似 结
  • 如何在 Android 中使用 C# 生成的 RSA 公钥?

    我想在无法假定 HTTPS 可用的情况下确保 Android 应用程序和 C ASP NET 服务器之间的消息隐私 我想使用 RSA 来加密 Android 设备首次联系服务器时传输的对称密钥 RSA密钥对已在服务器上生成 私钥保存在服务器
  • 编译时展开 for 循环内的模板参数?

    维基百科 here http en wikipedia org wiki Template metaprogramming Compile time code optimization 给出了 for 循环的编译时展开 我想知道我们是否可以
  • 有没有办法让 doxygen 自动处理未记录的 C 代码?

    通常它会忽略未记录的 C 文件 但我想测试 Callgraph 功能 例如 您知道在不更改 C 文件的情况下解决此问题的方法吗 设置变量EXTRACT ALL YES在你的 Doxyfile 中
  • C++ 继承的内存布局

    如果我有两个类 一个类继承另一个类 并且子类仅包含函数 那么这两个类的内存布局是否相同 e g class Base int a b c class Derived public Base only functions 我读过编译器无法对数
  • C# 使用“?” if else 语句设置值这叫什么

    嘿 我刚刚看到以下声明 return name null name NA 我只是想知道这在 NET 中叫什么 是吗 代表即然后执行此操作 这是一个俗称的 条件运算符 三元运算符 http en wikipedia org wiki Tern
  • Mono 应用程序在非阻塞套接字发送时冻结

    我在 debian 9 上的 mono 下运行一个服务器应用程序 大约有 1000 2000 个客户端连接 并且应用程序经常冻结 CPU 使用率达到 100 我执行 kill QUIT pid 来获取线程堆栈转储 但它总是卡在这个位置
  • 现代编译器是否优化乘以 1 和 -1

    如果我写 template
  • 如何确定 CultureInfo 实例是否支持拉丁字符

    是否可以确定是否CultureInfo http msdn microsoft com en us library system globalization cultureinfo aspx我正在使用的实例是否基于拉丁字符集 我相信你可以使

随机推荐

  • [译] APT分析报告:03.OpBlueRaven揭露APT组织Fin7/Carbanak(上)Tirion恶意软件

    这是作者新开的一个专栏 主要翻译国外知名的安全厂商APT报告文章 了解它们的安全技术 学习它们溯源APT组织的方法 希望对您有所帮助 前文分享了钓鱼邮件网址混淆URL逃避检测 这篇文章将介绍APT组织Fin7 Carbanak的Tirion
  • 什么浏览器好用稳定速度快?

    什么浏览器好用稳定速度快 说到浏览器 不知道你们是否有这样的困惑和烦恼 浏览器换了一款又一款 内存大就不说了 体验总是不尽人意 经常弹出一些莫名其妙的资讯 还会出现卡住 奔溃 网页打开不完全 打开速度慢等情况 就拿我最近用的两款360来说吧
  • Nginx+lua实现秒杀系统架构

    能今天做好的事就不要等到明天 以梦为马 学习趁年华 文章目录 前言 一 秒杀业务特点 1 瞬时高并发 2 热点数据 3 读多写少 二 技术难点 1 数据一致性 2 库存超卖 三 秒杀注意事项 1 数据预热 2 请求承载 3 请求拦截 四 微
  • 重新理解Linux交叉编译及编译流程

    参考书籍 1 编译原理 2 嵌入式Linux应用开发 文章目录 一 交叉编译背景 二 gcc和arm linux gcc的常用选项 1 查询gcc帮助 2 常用gcc选项介绍 3 生成一个可执行文件的三种方法 二 交叉编译的四个流程及实例说
  • iOS编程基础-OC(六)-专家级技巧:使用ARC

    该系列文章系个人读书笔记及总结性内容 任何组织和个人不得转载进行商业活动 第6章 专家级技巧 使用ARC 本章是第一部分的最后一章 本章介绍ARC内存管理中的细微之处 如直接桥接对象使用ARC的方法 6 1 ARC和对象所有权 我们已经知道
  • 快排-java

    快排总结 分区方法 3个while 递归使用排序方法 使用了分治法 挖坑赋值法 package cn com import java util Arrays public class QuickSort public static void
  • 虚拟机上CentOS 7关闭防火墙操作

    虚拟机上CentOS 7关闭防火墙操作 1 首先查看防火墙的状态 使用的命令为 service iptables status 提示 Unit iptables service could not be found 解决方案 还原传统的管理
  • sprintf实例

    include
  • Unity热更新 ILRuntime 从零开始 HelloWorld(二)

    自从我凌晨两点放下喝醉的小姐姐回家写博客之后 小姐姐对我愈发的崇拜了 约我今晚一块学习ILRuntime 带好身份证 我这一想必须要未雨绸缪 安排 选了一个全市最好的网吧 斥巨资通宵5元 请小姐姐一块学习 一起记录下学习内容 这是这一系列文
  • 数字频率计设计

    FPGA教程目录 MATLAB教程目录 设计任务与要求 1 设计任务 设计并实现一个数字频率计 2 基本要求 测频率范围 10Hz 10K Hz 为保证测量精度分为三个频段 10Hz 100 Hz 100Hz 1K Hz 1 K Hz 10
  • lua语言json与table互转,简单方法

    使用方法 1 json转table luaJson json2lua tab 2 table转json luaJson table2json str 这个原理就是是逐个解析字符串 同样可以解析json xml 具体代码如下 这里解析json
  • wayland详解

    简单地说 Wayland是一套display server Wayland compositor 与client间的通信协议 而Weston是Wayland compositor的参考实现 其官网为http wayland freedesk
  • 如何制作网站?如何制作网站教程

    如果公司企业想要知道如何制作网站 那么需要了解一些相关的内容 本文将介绍如何制作网站教程 希望对大家有所帮助 首先我们做好一些准备 域名 建站工具 图文素材 营业执照等资质 步骤一 创建站点 进入建站工具 24 fkw com 后 在工具中
  • 前端Vue自定义精美商品分类组件category 可用于电商应用分类页面

    随着技术的发展 开发的复杂度也越来越高 传统开发方式将一个系统做成了整块应用 经常出现的情况就是一个小小的改动或者一个小功能的增加可能会引起整体逻辑的修改 造成牵一发而动全身 通过组件化开发 可以有效实现单独开发 单独维护 而且他们之间可以
  • 贝叶斯分类

    贝叶斯分类 贝叶斯分类是一类分类算法的总称 这类算法均以贝叶斯定理为基础 故统称为贝叶斯分类 本文作为分类算法的第一篇 将首先介绍分类问题 对分类问题进行一个正式的定义 然后 介绍贝叶斯分类算法的基础 贝叶斯定理 最后 通过实例讨论贝叶斯分
  • [Cmake]源码编译安装Cmake

    源码编译安装Cmake 获取cmake软件包 解压并进入软件包目录 执行配置 编译和安装命令 设置环境变量 执行如下命令验证是否安装成功 获取cmake软件包 wget https cmake org files v3 18 cmake 3
  • PTA 7-3 求整数序列中出现次数最多的数 (10 分)

    本题要求统计一个整型序列中出现次数最多的整数及其出现次数 输入格式 输入在一行中给出序列中整数个数N 0
  • ELF文件头结构

    转自 https blog csdn net tangyuesb article details 54630787 ELF文件头结构定义在 usr include elf h 头文件下 ELF文件有32位版本和64位版本 故其头文件结构也有
  • 进度条教程【github.com/cheggaaa/pb】

    进度条 学习目标 学习内容 前置说明 一个简单的进度条案列 多个进度条的联合使用 进度条在文件Copy IO流的运行 学习总结 学习目标 了解进度条运行原理 掌握github com cheggaaa pb第三方依赖的函数 实践一个进度条
  • 【基础知识】什么是哈希冲突?

    1 什么是哈希表 哈希表 Hash Table 是一种数据结构 它可以快速地在大量数据中查找 插入和删除时数据 哈希表通过使用哈希函数将键 Key 映射到一个位置 然后在该位置存储或查找数据 哈希函数的作用是 将键转换为一个整数 这个整数通