为什么以下两个重复查找算法的时间复杂度不同？

2024-03-27

我正在读这个question https://stackoverflow.com/questions/3951547/java-array-finding-duplicates。所选答案包含以下两种算法。我不明白为什么第一个的时间复杂度是O(ln(n))。在最坏的情况下，如果数组不包含任何重复项，它将循环 n 次，第二个也是如此。我错了还是我错过了什么？谢谢

1）更快（极限）的方式

这是一种基于哈希的方法。你必须为自动装箱付费，但它是 O(ln(n)) 而不是 O(n2)。一个有进取心的人会去寻找一个基于 int 的原始哈希集（我认为 Apache 或 Google Collections 有这样的东西。）

boolean duplicates(final int[] zipcodelist)
{
  Set<Integer> lump = new HashSet<Integer>();
  for (int i : zipcodelist)
  {
    if (lump.contains(i)) return true;
    lump.add(i);
  }
  return false;
}

2）向海勒鞠躬

请参阅 HuyLe 的答案，了解或多或少的 O(n) 解决方案，我认为这需要几个附加步骤：

static boolean duplicates(final int[] zipcodelist) {    
    final int MAXZIP = 99999;    
    boolean[] bitmap = new boolean[MAXZIP+1];    
    java.util.Arrays.fill(bitmap, false);    

    for (int item : zipcodeList)
        if (!bitmap[item]) bitmap[item] = true;
        else return true;    
    }

    return false; 
}

第一个解决方案的预期复杂度应该为 O(n)，因为必须遍历整个邮政编码列表，并且处理每个邮政编码的预期时间复杂度为 O(1)。

即使考虑到插入 HashMap 可能会触发重新哈希，复杂度仍然是O(1) http://www.cs.cornell.edu/courses/cs312/2008sp/lectures/lec20.html。这有点不合逻辑，因为 Java HashMap 和链接中的假设之间可能没有关系，但它表明这是可能的。

From HashSet http://docs.oracle.com/javase/1.4.2/docs/api/java/util/HashSet.html文档：

本课程提供恒定时间基本操作的性能（add，消除，contains和大小），假设哈希函数将元素正确地分散在桶中。

第二个解也是一样，分析正确：O(n)。

（只是一个题外话，BitSet 比数组更快，如原始帖子中所示，因为 8booleans 被打包成 1byte，使用更少的内存）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么以下两个重复查找算法的时间复杂度不同？的相关文章

分而治之算法找到两个有序元素之间的最大差异

给定一个整数数组 arr 找出任意两个元素之间的差异使得较大的元素出现在 arr 中较小的数字之后 Max Difference Max arr x arr y x gt y 例子如果数组是 2 3 10 6 4 8 1 7 那么返回值
“包含字符串”的快速索引

在我的应用程序中我有多达数百万个短字符串大部分短于 32 个字符我想实现一个带有附加列表的搜索框该列表仅包含包含在搜索框中输入的整个字符串的元素如何预先建立索引来快速找到此类字符串所有排序的 STL 容器都会检查整个字符串对于
什么是“朴素”算法，什么是“封闭式”解决方案？

我有一些关于描述算法时使用的术语语义的问题首先朴素算法是什么意思这与给定问题的其他解决方案有何不同解决方案还可以采取哪些其他形式其次我听到很多人提到封闭式解决方案我也不知道这意味着什么但在尝试解决递归关系时经常会出现
当给定块大小时反转单链表

有一个单连接链表并给出了块大小例如如果我的链表是1 gt 2 gt 3 gt 4 gt 5 gt 6 gt 7 gt 8 NULL我的块大小是4然后反转第一个4元素然后是第二个 4 个元素问题的输出应该是4 gt 3 gt 2 g
Python 旅行商贪婪算法 [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案因此我为旅行推销员问题创建了一种排序并按 x 坐标和 y 坐标进行排序我正在尝试实施贪婪搜索但无法做到此外每
如何在C中实现带连分数的自然对数？

这里我有一个小问题根据这个公式创建一些东西这就是我所拥有的但它不起作用弗兰基我真的不明白它应该如何工作我尝试用一些错误的指令对其进行编码 N 是迭代次数和分数部分我认为它会以某种方式导致递归但不知道如何谢谢你的帮助 do
我应该对算法使用递归还是记忆化？

如果我可以选择使用递归或记忆来解决问题我应该使用哪一个换句话说如果它们都是可行的解决方案因为它们提供了正确的输出并且可以在我正在使用的代码中合理地表达那么我什么时候会使用其中一个而不是另一个它们并不相互排斥您可以同时使用它们
优化计算中使用的 # 个线程的算法

我正在执行一个操作我们将其称为CalculateSomeData CalculateSomeData 在连续的代中运行编号为 1 x 整个运行中的代数由CalculateSomeData 的输入参数固定并且是先验已知的完成一次生
UNIX 统计时间格式

是否可以格式化 stat 的时间输出我在用 stat c n A z filename 在 bash 脚本中但它的时间格式不是我想要的是否可以在命令中更改此格式或者我必须稍后手动执行此操作示例输出如下 lib drwxr xr x
颜色逻辑算法

我们正在构建一个体育应用程序并希望将团队颜色融入到应用程序的各个部分现在每个团队都可以使用几种不同的颜色来表示我想做的是执行检查以验证两个团队颜色是否在彼此一定的范围内这样我就不会显示两个相似的颜色因此如果团队 1 的主要团队
使用什么算法来确定使系统达到“零”状态所需的最小操作数？

这是一种更通用的问题不是特定于语言的有关要使用的想法和算法的更多信息系统如下它登记朋友群体之间的小额贷款 Alice and Bill要去吃午饭比尔的卡坏了所以爱丽丝支付了他的餐费 10 美元第二天Bill and Charl
为什么 Dijkstra 算法使用减密钥？

Dijkstra 教给我的算法如下 while pqueue is not empty distance node pqueue delete min if node has been visited continue else mark
调度算法，找到设定长度的所有非重叠区间

我需要为我的管理应用程序实现一种算法该算法将告诉我何时可以将任务分配给哪个用户我实现了一个蛮力解决方案它似乎有效但我想知道是否有更有效的方法来做到这一点为了简单起见我重写了算法以对数字列表进行操作而不是数据库查询等下面我将尝
你能用 C# 编写一个同样优雅的排列函数吗？

我非常喜欢这个 6 行解决方案并尝试在 C 中复制它基本上它会排列数组的元素 def permute xs pre if len xs 0 yield pre for i x in enumerate xs for y in perm
大 ר 符号到底代表什么？

我真的很困惑大 O 大 Omega 和大 Theta 表示法之间的区别我知道大 O 是上限大 Omega 是下限但是大 theta 到底代表什么我读过这意味着紧束缚但是这是什么意思首先我们来了解一下什么是大O 大Theta和大
从 float 转换的 Ruby Time 对象不等于原始 Time 对象

time Time now fvalue time to f return time Time at fvalue 有人可以解释为什么上面的表达式返回 false 吗如何从 float 创建一个与原始时间变量匹配的新 Time 对象 Th
对 Java 中 *any* 类的所有实例进行全排序

我不确定以下代码是否能确保 Comparator 的 Javadoc 中给出的所有条件 class TotalOrder
从给定的项目列表创建子列表

我首先要说的是以下问题不是为了家庭作业目的即使因为我几个月前就完成了软件工程师的工作无论如何今天我正在工作一位朋友向我询问了这个奇怪的排序问题我有一个包含 1000 行的列表每行代表一个数字我想创建 10 个子列表每个子列表都
Gekko - 最佳调度的不可行解决方案，与 gurobi 的比较

我对 Gurobi 有点熟悉但转向 Gekko 因为后者似乎有一些优势不过我遇到了一个问题我将用我想象的苹果园来说明这一问题 5周的收获期 horizon T 5 就在我们身上我的非常微薄的产出将是 3 0 7 0 9 0 5
实时战略战争游戏人工智能算法

我正在设计一款实时策略战争游戏其中 AI 将负责控制大型六边形地图上的大量单位可能超过 1000 个一个单位有许多行动点可以用于移动攻击敌方单位或各种特殊行动例如建造新单位例如一辆拥有 5 个行动点的坦克可以花费 3 个行动

随机推荐

java.lang.ClassNotFoundException：com.sun.faces.config.ConfigureListener

我们是三个人开发一个 JSF 项目但我们以前从未接触过 JSF 奇怪的是使用从 SVN 检查的相同数据其中一位团队成员每次使用 Tomcat 7 0 27 都会收到 404 错误当Tomcat 在Eclipse中使用启动时会写出
默认情况下使用 unifdef 省略未定义的预处理器分支的方法？

我正在使用复杂的 C 代码其中包含许多编译选项这使得代码很难阅读我想生成一份反映代码的副本它实际编译的方式我使用 unifdef 得到了很好的结果实用程序直到最近我才知道但我很困惑为什么这么难调用我想知道我是否遗漏了一
Cordova 5.0.0：我应该将哪些文件提交到 git？

我使用 Cordova 5 0 0 并且我有以下项目结构 MyProject hooks platforms plugins resources www config xml 我现在的问题是我可以省略哪些文件夹我问这个问题是因为我在三个
展平元组列表[重复]

这个问题在这里已经有答案了如何将元组列表中的所有元素循环到空列表中例如 tup Before 69592 69582 69582 69518 69518 69532 69532 69525 tup After 69592 69582 6
使用 ggplot 和 pandas 在 Python 中绘制事件密度

我正在尝试可视化这种形式的数据 timestamp senderId 0 735217 106758968942084595234 1 735217 114647222927547413607 2 735217 10675896894208
JavaScript 语法：字符串赋值语句中的内联 If

我最近遇到了这个问题我认为这会是一个很好的问题假设您将一个字符串分配给一个局部变量并且您想通过一个简单的条件来改变它因此您将内联 if 语句插入到字符串中 var someCondition true var url beginn
在 Contiki 程序中使用 malloc

考虑以下 Contiki 程序 include
Node JS，传统数据结构？（如 Set 等），类似于 Node 的 Java.util 之类的东西？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我喜欢 Node JS 并且有 Java 背景甚至有兴趣在某些 Node 看起来有点牵强的项目中尝试
nasm：在运行时从 rip（指令指针）获取重定位二进制文件的偏移量

我有一个适用于 x86 64 的 multiboot2 兼容 ELF 文件其中启动符号定义在start asm NASM 汇编文件 multiboot2 标头包含relocatable tag 因为 GRUB 不支持 multiboot2
Flask URL路由编码问题

我偶然发现了一个奇怪的 Unicode Flask 中的 URL 编码问题 app route it2
为什么此 C++ 代码可以使用某些编译器编译，而不能使用其他编译器编译？

我在做作业时注意到我笔记本电脑上的编译器比我们用于提交的机器上的编译器要宽容得多我笔记本电脑上的 C 编译器是AppleClang 7 0 2 7000181 提交框上的编译器是g 4 9 2 回想起来不应该编译的代码是 includ
付款错误：PayPal 错误：请求无效。查看具体信息。 (VALIDATION_ERROR) 贝宝

我在我的项目中使用 PayPal 定期付款我想在一段时间内提供一次免费试用并且初始订单总额应该为零一旦免费试用完成实际订单金额将从帐户中扣除例如用户购买一个产品 100 美元并申请免费试用折扣代码则第一个订单应以 0 美元下
将 Bundle 传递给 startActivityForResult 以实现场景转换

我正在玩棒棒糖sceneTransitionAnimations 为了让它发挥作用你需要实施getWindow setExitTransition getWindow setReenterTransition 在调用活动的onCreate
Spring Security 3.2.0.RC1 - 元素和已弃用的方法

升级到 Spring Security 3 2 0 RC1 后我收到警告 Method setFilterProcessesUrl is tagged deprecated
带有客户端证书的嵌入式 Jetty

我想创建嵌入式 https 服务器要求客户端提供证书我正在使用它 http www smartjava org content embedded jetty client certificates http www smartjava
拉取请求的 Bitbucket 构建状态显示失败的构建，而不是最新的构建状态

我将 Bitbucket 与 Cloudbees 集成具有以下工作流程每次用户创建 Pull 请求时都将其作为目标develop分支 cloudbees 中的多分支管道将聚集拉取请求例如 PR 34 并将触发第一个构建 1 如果通过
颜色条上的日志标签

我有一个对数 imshow 图当创建颜色条时它的轴标签和刻度是对数的但由于值的范围较短 0 50 颜色条看起来像这样我希望它显示为沿轴间隔的 0 5 10 20 50 对数间距 Use the LogFormatter https
在 Bash 中打开默认文本编辑器？

我在编写 shell 脚本时遇到了一个问题有没有办法使用用户指定的文本编辑器打开文件用户选择的编辑器应该位于 EDITOR 但您仍必须选择合理的默认值 EDITOR vi file txt
向该对象的每一面添加不同的颜色

我为我的应用程序重新创建了一个包模型并将其作为 obj 导出到 ThreeJs 中我为模型几何中发现的每个面分配了不同的颜色如下所示 var geometry new THREE Geometry fromBufferGeometry
为什么以下两个重复查找算法的时间复杂度不同？

我正在读这个question https stackoverflow com questions 3951547 java array finding duplicates 所选答案包含以下两种算法我不明白为什么第一个的时间复杂度是O l

为什么以下两个重复查找算法的时间复杂度不同？

为什么以下两个重复查找算法的时间复杂度不同？ 的相关文章

随机推荐

热门标签

为什么以下两个重复查找算法的时间复杂度不同？的相关文章