O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的

2023-12-07

昨天算法考试的时候遇到了这个问题，我不知道答案。这简直让我抓狂，因为它大约值 40 分。我估计全班大部分人都没有正确解决这个问题，因为我在过去 24 小时内还没有想出解决方案。

给定一个长度为 n 的任意二进制字符串，如果存在，请在该字符串中找到三个均匀间隔的字符串。编写一个算法，在 O(n * log(n)) 时间内解决这个问题。

因此，像这样的字符串具有三个“均匀间隔”的字符串：11100000、0100100100

编辑：它是一个随机数，因此它应该能够适用于任何数字。我给出的例子是为了说明“均匀分布”的性质。所以 1001011 是一个有效的数字。其中 1、4 和 7 是均匀分布的。

最后！跟进线索sdcvvc 的回答，我们有了：解决该问题的 O(n log n) 算法！理解之后也很简单。那些猜测 FFT 的人是对的。

问题：给定一个二进制字符串S长度n，我们想在其中找到三个均匀分布的 1。例如，S may be 110110010, where n=9。它在位置 2、5 和 8 处均匀间隔有 1。

Scan S从左到右，并列出一个列表L位置 1. 对于S=110110010上面，我们有列表 L = [1, 2, 4, 5, 8]。这一步的时间复杂度为O(n)。现在的问题是找到一个长度为 3 的算术级数 in L，即找到不同的a, b, c in L这样b-a = c-b，或等价地a+c=2b。对于上面的示例，我们想要找到级数 (2, 5, 8)。
Make a polynomial p with terms x^k for each k in L. For the example above, we make the polynomial p(x) = (x + x² + x⁴ + x⁵+x⁸). This step is O(n).
Find the polynomial q = p², using the Fast Fourier Transform. For the example above, we get the polynomial q(x) = x¹⁶ + 2x¹³ + 2x¹² + 3x¹⁰ + 4x⁹ + x⁸ + 2x⁷ + 4x⁶ + 2x⁵ + x⁴ + 2x³ + x². This step is O(n log n).
Ignore all terms except those corresponding to x^2k for some k in L. For the example above, we get the terms x¹⁶, 3x¹⁰, x⁸, x⁴, x². This step is O(n), if you choose to do it at all.

Here's the crucial point: the coefficient of any x^2b for b in L is precisely the number of pairs (a,c) in L such that a+c=2b. [CLRS, Ex. 30.1-7] One such pair is (b,b) always (so the coefficient is at least 1), but if there exists any other pair (a,c), then the coefficient is at least 3, from (a,c) and (c,a). For the example above, we have the coefficient of x¹⁰ to be 3 precisely because of the AP (2,5,8). (These coefficients x^2b will always be odd numbers, for the reasons above. And all other coefficients in q will always be even.)

So then, the algorithm is to look at the coefficients of these terms x^2b, and see if any of them is greater than 1. If there is none, then there are no evenly spaced 1s. If there is a b in L for which the coefficient of x^2b is greater than 1, then we know that there is some pair (a,c) — other than (b,b) — for which a+c=2b. To find the actual pair, we simply try each a in L (the corresponding c would be 2b-a) and see if there is a 1 at position 2b-a in S. This step is O(n).

就这些了，伙计们。

One might ask: do we need to use FFT? Many answers, such as beta's, flybywire's, and rsp's, suggest that the approach that checks each pair of 1s and sees if there is a 1 at the "third" position, might work in O(n log n), based on the intuition that if there are too many 1s, we would find a triple easily, and if there are too few 1s, checking all pairs takes little time. Unfortunately, while this intuition is correct and the simple approach is better than O(n²), it is not significantly better. As in sdcvvc's answer, we can take the "Cantor-like set" of strings of length n=3^k, with 1s at the positions whose ternary representation has only 0s and 2s (no 1s) in it. Such a string has 2^k = n^{(log 2)/(log 3)} ≈ n^0.63 ones in it and no evenly spaced 1s, so checking all pairs would be of the order of the square of the number of 1s in it: that's 4^k ≈ n^1.26 which unfortunately is asymptotically much larger than (n log n). In fact, the worst case is even worse: Leo Moser in 1953 constructed (effectively) such strings which have n^{1-c/√(log n)} 1s in them but no evenly spaced 1s, which means that on such strings, the simple approach would take Θ(n^{2-2c/√(log n)}) — only a tiny bit better than Θ(n²), surprisingly!

About the maximum number of 1s in a string of length n with no 3 evenly spaced ones (which we saw above was at least n^0.63 from the easy Cantor-like construction, and at least n^{1-c/√(log n)} with Moser's construction) — this is OEIS A003002. It can also be calculated directly from OEIS A065825 as the k such that A065825(k) ≤ n < A065825(k+1). I wrote a program to find these, and it turns out that the greedy algorithm does not give the longest such string. For example, for n=9, we can get 5 1s (110100011) but the greedy gives only 4 (110110000), for n=26 we can get 11 1s (11001010001000010110001101) but the greedy gives only 8 (11011000011011000000000000), and for n=74 we can get 22 1s (11000010110001000001011010001000000000000000010001011010000010001101000011) but the greedy gives only 16 (11011000011011000000000000011011000011011000000000000000000000000000000000). They do agree at quite a few places until 50 (e.g. all of 38 to 50), though. As the OEIS references say, it seems that Jaroslaw Wroblewski is interested in this question, and he maintains a website on these non-averaging sets. The exact numbers are known only up to 194.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

bigo

O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的的相关文章

从二维排序数组中查找第 k 个最大元素

我有一个二维数组行和列已排序如何从二维数组中找到第 k 大元素如果你有一个n n矩阵那么可以在平均时间内完成此操作O n log n log n 您所做的是将矩阵分解为一系列排序数组然后立即对所有数组进行二分搜索例如假设n 4并
iOS心率检测算法

我正在尝试在我正在开发的应用程序中实现心跳记录功能首选方法是使用 iPhone 的摄像头在灯亮的情况下让用户将手指放在镜头上然后检测视频源中与用户心脏相对应的波动我通过以下堆栈溢出问题找到了一个非常好的起点here https s
如何验证无锁算法？

从理论上讲至少应该可以对无锁算法进行暴力验证只有这么多的函数调用组合是否有任何工具或正式推理过程可以实际证明无锁算法是正确的理想情况下它还应该能够检查竞争条件和 ABA 问题注意如果你知道一种方法来证明一点例如只证明它不受
地图应用的聚类算法

我正在研究地图上的聚类点纬度经度对于快速且可扩展的合适算法有什么建议吗更具体地说我有一系列纬度经度坐标和一个地图视口我正在尝试将靠近的点聚集在一起以消除混乱我已经有了解决问题的方法 see here http bouldr
数组中的重复元素[重复]

这个问题在这里已经有答案了这有点与this https stackoverflow com questions 2605766 how to find a duplicate element in an array of shuffled
关于大O和大Omega的问题

我认为这可能是一个关于大 O 表示法的初学者问题举例来说我有一个算法可以递归地分解整个列表 O n 然后将其重新组合在一起 O n 我假设这意味着效率为 O n O n 这是否可以简化为 2O n O 2n 或 O n 根据我对这种表
识别鼠标移动的算法

我想知道是否有任何研究算法可以指定鼠标在识别等字符时的偏差量使用鼠标绘制某种光学字符识别但可能是一个更简单的版本是否有某种算法可以让我说用户绘制的问号确实是一个问号而不是其他具有一定准确性的东西就像 Windows 平板电脑软
StackOverflowError 计算 BigInteger 的阶乘？

我正在尝试编写一个Java程序来计算大数的阶乘它似乎BigInteger无法容纳这么大的数量下面是我编写的简单的代码 public static BigInteger getFactorial BigInteger num if n
用于计算三角函数、对数或类似函数的算法。仅限加减法

我正在修复 Ascota 170 古董机械可编程计算机它已经开始工作了现在我正在寻找一种算法来展示其功能例如计算三角或对数表或类似的东西不幸的是从数学运算来看计算机只能进行整数的加减法从 1E12到1E12的55个寄存器甚
运行时间为 O(n) 且就地排序的排序算法

有没有运行时间为O n 并且还分类到位在某些情况下最好的情况是 O n 但这可能是因为项目集合已经排序你正在看 O nlogn 一些较好的平均值话虽如此排序算法的 Wiki 还是相当不错的有一个表格比较了流行的算法说明了它们的
简单的排名算法

我需要创建一个民意调查按照项目的好坏顺序创建一个排名列表我打算向每个用户展示两个项目让他们选择一个他们认为更好的项目然后多次重复这个过程它有点类似于您在社交网络电影我应该如何根据收到的答案对项目进行排名看着那这ELO国际象棋
关于Marching Cubes算法的澄清

关于Marching Cubes 我对其算法和实现有一些疑问我已经阅读了 Marching Cubes 的 Paul Bourke 优秀文章以及网站上可用的源代码但是我在理解以及如何以自己的方式实现算法方面仍然遇到了一些问题问题如下
定点数学比浮点运算快吗？

多年前即 20 世纪 90 年代初期我构建了图形软件包该软件包基于定点算术和预先计算的 cos sin 表格以及使用牛顿近似方法进行 sqrt 和对数近似的缩放方程来优化计算这些先进技术似乎已经成为图形和内置数学处理器的一部分大约
Python Pandas：沿一列比较两个数据帧，并返回另一个数据帧中两个数据帧的行内容

我正在处理两个 csv 文件并作为数据框 df1 和 df2 导入 df1 有 50000 行 df2 有 150000 行我想将 df2 的时间与 df1 求时间差并返回所有列的值对应相似的行保存在df3中时间同步例如 35
在任意时间范围内找到最佳日/月/年间隔的算法？

如果您有时间表请说 March 19 2009 July 15 2011 是否有一种算法可以将该时间范围分解为 March 19 2009 March 31 2009 complete days April 1 2009 December
如何求两个地点的经纬度距离？

我有一组位置的纬度和经度怎么找distance从集合中的一个位置到另一个位置有公式吗半正矢公式假定地球是球形的然而地球的形状更为复杂扁球体模型会给出更好的结果如果需要这样的精度你应该更好地使用文森特逆公式 See http
LRU算法，实现这个算法需要多少位？

我有一个关于 LRU 算法的小问题如果您有一个包含四个块的高速缓存那么需要多少位来实现该算法假设您指的是 4 路组关联缓存完美 LRU 本质上是按照使用顺序为每一行分配一个精确的索引您也可以将其视为年龄因此 4 个元素中的每一
heapq.nlargest 的时间复杂度是多少？

我在看演讲者说获得t列表中最大的元素n元素可以在O t n 这怎么可能我的理解是创建堆将是O n 但是复杂度是多少nlargest本身就是O n t or O t 实际的算法是什么在这种情况下说话者是错误的实际成本是O n log
我应该对算法使用递归还是记忆化？

如果我可以选择使用递归或记忆来解决问题我应该使用哪一个换句话说如果它们都是可行的解决方案因为它们提供了正确的输出并且可以在我正在使用的代码中合理地表达那么我什么时候会使用其中一个而不是另一个它们并不相互排斥您可以同时使用它们
如何计算 3D Morton 数（交织 3 个整数的位）

我正在寻找一种快速计算 3D Morton 数的方法这个网站 http www graphics stanford edu seander bithacks html InterleaveBMN有一个基于幻数的技巧来处理 2D Morto

随机推荐

进行系统调用，以字符串形式返回 stdout 输出

Perl 和 PHP 通过反引号来实现这一点例如 output ls 返回目录列表类似的功能 system foo 返回给定命令 foo 的操作系统返回代码我正在讨论一个变体它将 foo 打印的任何内容返回到标准输出其他语言是如何
matplotlib matshow：如何根据缩放向量更改每行高度？

使用标准 matshow 示例 from matplotlib pylab import dim 12 12 aa zeros dim for i in range min dim aa i i i matshow aa show sour
无法停止游戏场景、Swift 3/Spritekit 中的背景音乐

在 XCODE 8 Swift 3 和 Spritekit 上我正在播放背景音乐一首 5 分钟的歌曲从 GameViewController 的 ViewDidLoad 调用它从所有场景的父级而不是从特定的 GameScene 因
AttributeError：'MapDataset'对象在tensorflow_federated TFF中没有属性'client_ids'

我正在尝试测试联合学习中的压缩技术non IID使用此 API tff simulation datasets build single label dataset 遵循以下帖子 TensorFlow Federated 如何调整联合数据集
尝试使用 vbscript 显示 SQL 数据库中的数据

我正在尝试在 VBScript 内建立与 SQL 服务器的连接每当我连接到 SQL 服务器时网页上就会出现错误显示处理 URL 时出现问题并需要联系管理员我知道我的连接字符串是正确的因为它适用于所有其他页面这是我迄今为止用来
python 3 pycrypto iv 必须是 16 个字节长

所以我一直在尝试根据 github pycrypto 指南构建一个 AES 加密程序链接到 github但是当我去解码时出现错误 Traceback most recent call last File home pi Desktop ae
带单引号的整数文字？ [复制]

这个问题在这里已经有答案了到底什么被赋予了价值我很惊讶这竟然已经编译完成了 g 7 4 0 include
在生产服务器上初始化私有存储库

我现在想做的是将生产服务器上的私有存储库初始化到应用程序的 www 文件夹例如 var www app com web 然后将其作为临时存储库克隆到我的测试站点例如 var www test com web app com 并最终从暂存
Python PANDAS：如何将 One-Hot 编码反转回分类[重复]

这个问题在这里已经有答案了我有一个具有以下总体布局的数据框 id ind 1 ind 2 ind 3 1 0 1 0 1 1 0 0 2 0 1 0 2 0 0 1 3 0 0 1 3 1 0 0 我想添加一个附加列其值为 1 时的原始
VSTS Online - 使用 ClickOnce 签名 PFX 密码构建解决方案

我有一个正在 VSTS Online 中构建的 WPF 解决方案以下是我的基本构建定义在本地 Visual Studio 2017 中我分配了一次点击认证 PFX 一切都在本地构建和编译得很好构建失败并出现以下错误无法导入以下密钥
如何使用文件路径自动完成 bash 命令行？

Context 我正在创建一个 shell 程序它是一个命令行工具我想为这个工具创建我自己的自动完成功能我想做两件不同的事情也许我应该发布两个问题对于选项 install and i 我想自动完成文件路径例如ls命令执行对于选
将英文引号替换为德文引号

有没有办法实现德语引号所谓的 G nsef chen bdquo and ldquo 在转换英文引用字符串的函数中例如我说你好 to 我说你好 bdquo 应该只应用于字符串的开头 ldquo 应用于字符串的末尾关于什么 input
Django 计划任务 - Cron 或独立守护进程的替代方案

在创建计划任务时我使用了 Cron 和专门为 django 设置的守护进程 Cron 非常简单而且守护进程在我看来可能有点过多该守护进程设置了一个独立的 Django 实例无论如何 Django 本身如果我没记错的话作为守护
如何使用 Cordova FileTransfer 将文件上传到 Amazon S3？

我正在跟进Heroku 的教程直接上传到 Amazon S3 通过 Node js 应用程序从 AWS 获取签名请求后他们使用正常 XMLHttpRequest发送文件这是他们的功能 function upload file file
使用 Fabric.js 和 HTML5 在图像画布上编写自定义文本

我正在使用 HTML5 和fabric js用于上传多个图像我想在此图像画布上添加自定义文本现在我正在将多张图像一张一张地上传到画布中上传图像后我想在画布上添加自定义文本 var canvas new fabric Canvas c
遍历基于 tidyverse/rlang 的函数的输入值

我的功能foo非常适合一个输入值为其cat mod争论但我想知道如何让它接受多个输入cat mod鉴于使用rlang ensym cat mod 在我的函数中 foo lt function data study id cat mod s
如何读取多行原始输入？

我想创建一个接受多行用户输入的 Python 程序例如 This is a multilined input It has multiple sentences Each sentence is on a newline 如何获取多行原始
如何使用 Cypress Cucumber 预处理器实现单个测试的重试？

我目前面临的挑战是实现单独的测试重试以稳定一小部分特定测试这些测试依赖于某些后台处理因此往往不稳定我将 Cypress 9 2 0 与 TypeScript 和 Cypress Cucumber 预处理器 4 3 1 结合使用为了
为 RESTful WCF 配置 SSL 绑定。如何？

我当前的配置如下所示
O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的

昨天算法考试的时候遇到了这个问题我不知道答案这简直让我抓狂因为它大约值 40 分我估计全班大部分人都没有正确解决这个问题因为我在过去 24 小时内还没有想出解决方案给定一个长度为 n 的任意二进制字符串如果存在请在该字符串中

O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的

O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的 的相关文章

随机推荐

热门标签

O(nlogn) 算法 - 在二进制字符串中找到三个均匀分布的的相关文章