Git 哈希重复

2023-11-26

Git 允许使用以下命令检索提交的哈希值：

git rev-parse HEAD

这使33b316c or

git rev-parse --short HEAD

这使33b316cbeeab3d69e79b9fb659414af4e7829a32我知道实践中长哈希永远不会发生冲突。

在实践中，短哈希值的使用更为频繁。我想知道短的碰撞的概率是多少？ git 是否采取任何措施来克服可能的冲突（例如使用git checkout)?

I give a formula in my book—see pp. 78-79—but if you're looking for a simple one, the point at which the probability of some hash collision reaches about 50% in an n-bit hash is when you hash roughly 2^n/2 keys. The SHA-1 hash itself is 160 bits, represented as 40 hexadecimal digits, each representing 4 of the 160 bits. Truncating that to 7 hexadecimal digits leaves 28 bits, so you will reach 50%-chance-of-collision at about 2¹⁴ keys, or 16384 objects. If you constrain the objects to be only commits, that's a pretty decent number of commits, but Git places all objects—commits, trees, annotated tag objects, and blobs—in a single hash-indexed key-value store.

The probability of the hashes of any given pair of keys colliding is just 1 in 2ⁿ, i.e., 1 in 2²⁸ or 1 out of 268 million. The reason it increases so fast to 50%, as the number of keys grows, is known as the Birthday Paradox or birthday problem. 50% is of course far too scary; with 28 bits, if we want the overall probability to be below 0.1%, we should keep the number of objects below about 1230. By going to 32 bits (8 character abbrevations) we double this to about 2460, but that's still not very many objects.

By the time you have 16k objects in your store, you probably should use at least 10 hexadecimal digits, giving 2⁴⁰ possible hash values and a p-bar value of about .99987794... (about .019% chance of collisions). Nine hex digits gives only 2³⁶ hash values, producing a p-bar of .99804890... or 0.19% chance of collision, which I think is too high.

如果您可以将不明确匹配的代码限制为仅提交或仅提交式，在 Git 中意味着提交或带注释的标签——内置的默认设置运行得很好。（事实上，Git 在很多情况下都会这样做。）但是，至少在我看来，Git 用于计算“正确”缩写长度的内部代码也太随意了。“松散的”，因为它在结果哈希可能用于识别的上下文中使用 50% 碰撞概率平方根技巧any object.

（正如评论中指出的，内部Git 始终使用完整的哈希值。它仅在非 Git / Git 接口上，例如，git log <hash> or git show <hash>面向用户的命令，您可以输入缩写的哈希值，或要求缩写的输出哈希值。这里 Git 将默认使用 50% 碰撞概率数字来计算要显示的字符数，首先估计数据库中的对象数量。如果您提供哈希值，you选择供应量。如果您要求 Git 提供它，您仍然可以选择多少，使用--abbrev=number。请注意，绝对最小值为 4：git log abc不会治疗abc作为哈希 ID，但是git log abcd会治疗abcd作为哈希 ID 的缩写。还有一个非常古老的默认值，即 7 个字符，来自 Git 1.7 左右的时代。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Git 哈希重复的相关文章

您对版本控制进行到什么程度了？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Git - 显示远程分支的远程名称

是否有一个 Git 命令可以显示远程分支的远程名称目前我坚持使用 shell utils 从远程分支引用中提取远程名称例如 echo remote name branch name sed r s 1 remote name 有时出于
恢复 git reset --soft

我修改了我的分支中的一些文件并做了一个 git add all 但这添加了一些我不打算为提交添加的文件所以我做了一个 git reset soft HEAD 2 instead of doing git reset HEAD 但之前的提交
尽管有 svn 复制，如何 git svn 克隆完整历史记录

在我的公司我们即将从 svn 切换到 git 我们使用的 SVN 非常大没有 svn 布局并且在每个版本拆分上我们都制作了一个 svn 副本 SVN存储库结构 svnserver company de product xy 主要版本号
来自 eclipse 的部分 git 提交 (egit)

假设我有一个有 2 个更改的文件如何使用 egit 只提交其中之一命令行版本可以在以下位置找到this https stackoverflow com questions 1085162 commit only part of a fi
用给定均值截断正态分布

python 是否可以生成具有给定期望值的截断正态分布我知道 scipy stats truncnorm 可以给出截断的正态分布该分布取平均值original正态分布作为参数但我想创建一个截断正态分布使得截断分布的期望值是一个特定值
git 克隆错误：致命：git upload-pack：由于远程端可能的存储库损坏而中止

我对 git 存储库具有读写访问权限但是当我尝试 git clone 时出现以下错误 x ubuntu temp git clone email protected cdn cgi l email protection Corp ap
如何使用 git hook pre-merge-commit 获取原始合并分支名称

我正在尝试使用新的 git hook pre merge commit 创建一个特定的脚本但它没有参数有什么解决方法可以让我获得正在合并的分支的名称吗例子在分支 myBranch 上我调用 git merge testingBra
git for-each-ref - 按年龄过滤结果

我正在使用以下命令here https stackoverflow com a 39251131 5812876 git for each ref format color cyan authordate format m d Y I M
git 命令显示所有（轻量级）标签创建日期

是否有一个衬垫可以向我显示所有 git 轻量级标签的创建日期就像是 git show tags format date 我在这个发现link http osdir com ml git 2009 05 msg01404 html适合我需求
无法将 git add origin git@anything 与新的 git 目录一起使用

我有一个项目我正在生成许多提交因此它占用的空间正在快速增长由于我有一个 gitlab 页面来推送提交因此我决定最好删除本地 git 目录中的这些旧提交因为我始终可以从 gitlab 获取它们为此我只需删除本地 git 目录然
为什么在 Eclipse 中对 Egit 管理的项目禁用合并工具？

根据Egit 用户指南 http wiki eclipse org EGit User Guide Using Merge Tool 要使用合并工具应右键单击存在合并冲突的资源然后选择Team gt 合并工具但是当我执行此操作时合
迭代哈希数组

我编写了下面的例程迭代哈希值 0 7 并打印出每个哈希值中特定键的值我需要获取每个哈希中 b4 的值我想取消 0 7 当存在不同数量的哈希值时使用更智能的东西例如有时只有 2 个也可能有 160 个 my out decode
如何在本地快速拉取拉取请求

在合并拉取请求之前我想在本地快速拉取请求并运行测试并测试一些内容我还不想点击 gihub 合并拉取请求我以为滑轮会有帮助http ejohn org blog pulley http ejohn org blog pulley 但我收
hg 或 git 中的两个完整目录/项目之间存在差异？

我继承了一个最初存储在 CVS 中的项目以及所有修订我做了相当多的编辑并且我试图比较我在原始目录中所做的所有更改关于添加的新文件与旧文件 hg git 是否有某种实用程序可以让我进行树差异或类似性质的操作也就是说新添加的文件删除
Git 中的合并冲突是由什么构成的？

git 如何确定特定合并存在冲突以及冲突是什么我的猜测是这样的如果正在合并的两个提交有一个共同的父提交并且如果它们都更改了父提交的 X 行那就是冲突让我的理解变得复杂的是更改 X 行可能意味着用几行新行替换它但这仍然显示为一
如何通过哈希显示提交的日期和时间

I used git reflog识别我创建特定分支时的哈希值我得到了哈希值fe1ddcdef 我还没有将此分支推送到远程我现在正在尝试查找日期和时间fe1ddcdef发生 git reflog只告诉我 fe1ddcdef HEAD 1
从 xgb.train() 获取概率

我是 Python 和机器学习的新手我在网上搜索了我的问题并尝试了人们建议的解决方案但仍然没有得到它如果有人能帮助我我将非常感激我正在开发我的第一个 XGboost 模型我已经使用 xgb XGBClassifier 调整了参
Git 扩展 - 无法在 Windows 上推送到网络驱动器中的 git bare 存储库

我正在 Windows 上学习 git 我已经安装了 Git 扩展版本 2 47 3 并使用了它我在我的 C 单元中创建了一个裸存储库作为中央存储库并在硬盘中的其他任何位置创建了个人存储库我对硬盘中的这两个存储库进行提交推送和拉
自动生成/删除詹金斯工作

我正在寻找一种自动创建一组詹金斯作业的方法通常在创建新的 git 分支之后我已经为maven尝试过这个插件 http evgeny goldin com wiki Maven jenkins plugin http evgeny gol

随机推荐

在 WCF 中 - 在“故障”事件中 - 如何获取异常详细信息？

我有一个 WCF 服务器我正在利用故障事件该事件愚蠢地只给我对象发送者 EventArgs e 如何获取该事件中当前的异常对象或者如果有某种全局系统方式例如 Environment GetCurrentException
无法解析 Activity 的超类

我在基于 OpenGL ES 10 的新项目中收到此错误 09 03 12 44 07 870 W dalvikvm 599 Unable to resolve superclass of Lcom example basicgl10tes
应用函子：<*> 和部分应用，它是如何工作的

我正在看书Haskell 编程作者格雷厄姆赫顿 Graham Hutton 我有一些问题不明白如何 lt gt 部分应用程序可用于解析字符串我知道pure 1 lt gt Just 2产生Just 3因为pure 1 产生Just 1
Ruby on Rails：如果是当前页面？是主页，不显示表单

我不想显示表单但前提是当前页面不是主页这就是我到目前为止所拥有的我有我的路线设置 root projects index My view show some stuff 这不会显示网址是否为localhost 3000 project
Spring Security LDAP 身份验证用户必须是 AD 组的成员

我已经按照以下方式配置了 Spring Boot Security https spring io guides gs secure web 我可以完美地使用我的凭据登录但是我需要添加一个检查以确保 AD 用户也必须属于特定的 AD
C# 仅使用代码添加引用（没有 IDE“添加引用”功能）

我正在为一个程序编写一个插件我想将我的代码放入 DLL 中这样我就可以自由地共享该插件而无需暴露泄露我的代码这是我可以访问的基本结构 using System public class Plugin public void In
flutter - 自更新到 firebase 9.0.X 以来出现错误 event.snapshot.value

我收到错误event snapshot value自从更新到 firebase 9 0 5 以来我有很多这样的函数它们在 firebase 8 X 中运行良好 Stream
如何根据指定的行数拆分 CSV 文件？

我有 CSV 文件大约 10 000 行每行有 300 列存储在 LINUX 服务器上我想将此 CSV 文件分成 500 个 CSV 文件每个文件有 20 条记录每个都具有与原始 CSV 中相同的 CSV 标头有没有什么lin
Java HTTP/2 服务器套接字

我想让服务器套接字在 Java 中支持 HTTP 2 最好是 TLS https 我有一个 TLS 服务器套接字工作正常但浏览器只能与它对话 HTTP 1 1 如果我理解正确的话您需要 ALPN 来让 HTTP 2 浏览器连接到您的 T
如何在 SELECT 语句中使用 BOOLEAN 类型

我有一个参数为 BOOLEAN 的 PL SQL 函数 function get something name in varchar2 ignore notfound in boolean 此功能是第三方工具的一部分我无法更改它我想在
如何授予 ASP.NET 写入 Windows 7 文件夹的权限？

我有一个新的 Win7 工作站我正在尝试让 ScrewTurn Wiki 在该机器上运行我的 STW 安装使用文件系统选项来存储其数据因此我需要向网站安装文件夹中的 ASP NET 工作进程授予写入权限然而我似乎无法想出 Win7
如何更改 openshift 容器平台中的权限？

我是 Openshift 的新手我已经在 openshift 中部署了一个应用程序当我检查日志时某些文件存在权限被拒绝错误现在我想更改已部署在 Openshift 中的容器的权限但收到不允许操作警告我该如何解决这是针对运
面试：为集合的集合设计一个迭代器

在java中为集合的集合设计一个迭代器迭代器应该隐藏嵌套允许您迭代属于所有集合的所有元素就像使用单个集合一样这是一个老问题但现在 2019 年我们有了 JDK8 的好东西特别是我们有流这使得这项任务变得简单 public
自定义 Mathematica 快捷键

Is there a place I can view change global shortcut options like Command 9 turn into Input style 特别是我需要一种更快的方法来创建项目符号列表
从元组列表中格式化 JSON 字符串的更 Pythonic 方式

目前我正在这样做 def getJSONString lst join rs for i in lst rs join str i 0 str i 1 join return rs 我称之为 rs getJSONString name va
字符串中的 JSON 转义序列无效

我正在使用一个 MySQL 数据库它为谷歌地图编码了多边形当我尝试以 json 形式返回查询时 jsonlint 抱怨我不确定为什么它抱怨我确实尝试转义 latlon 中的但仍然得到相同的错误 Parse error on lin
JavaScript：打印前 12 个月——“March”打印两次？

我正在尝试编写一个脚本来打印过去 12 个月的名称由于本月是一月因此应该打印十二月十一月十月九月八月七月六月可能四月行进二月一月相反它打印 March 两次 http jsfiddle net h69gm04
有什么方法可以分析 firestore 数据库吗？

我的 Firestore 数据库中的实体写入数量非常多大多数路径的写入权限都受到限制通过后端服务器使用 admin SDK 完成只有极少数路径具有写访问权限特别是仅对已通过身份验证注册加入和批准的特定组的用户而言因此即使滥用的
连接到 Amazon RDS Oracle 实例时如何解决“读取调用减一”错误

我在 Amazon RDS 实例上运行 Oracle 11GR2 有时我会得到一个IO Error Got minus one from a read call当打电话给DriverManager getConnection getUrl
Git 哈希重复

Git 允许使用以下命令检索提交的哈希值 git rev parse HEAD 这使33b316c or git rev parse short HEAD 这使33b316cbeeab3d69e79b9fb659414af4e7829a32

Git 哈希重复

Git 哈希重复 的相关文章

随机推荐

热门标签

Git 哈希重复的相关文章