对具有相同域的大量集合执行子集测试操作的最快方法

2024-01-05

假设我们在某处存储了数万亿组数据。这些集合中的每一个的域都是相同的。它也是有限且离散的。因此，每个集合可以被存储为相对较短长度（例如：1024）的位字段（例如：0000100111...）。也就是说，位字段中的位 X 指示项目 X（1024 个可能的项目）是否包含在给定集合中。

现在，我想设计一种存储结构和算法来有效地回答查询：数据存储中的哪些集合将 Y 设置为子集。设置 Y 本身不存在于数据存储中，而是在运行时指定。

现在解决这个问题的最简单方法是将集合 Y 的位字段与数据存储中每个集合的位字段进行一一“与”操作，选择“与”结果与 Y 的位字段匹配的位字段。

我怎样才能加快速度？是否有树结构（索引）或某种智能算法可以让我执行此查询，而不必对每个存储集的位字段进行 AND 操作？

是否有数据库已经支持对大型集合进行此类操作？

如果您可以预处理这些集合，则子集关系可以表示为 DAG（因为您正在描述一个偏序集）。如果计算了传递约简，那么我认为您可以通过从最大集合开始执行 DFS 并在 Y 不再是当前访问集合的子集时停止来避免测试所有集合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对具有相同域的大量集合执行子集测试操作的最快方法的相关文章

使用什么算法来确定使系统达到“零”状态所需的最小操作数？

这是一种更通用的问题不是特定于语言的有关要使用的想法和算法的更多信息系统如下它登记朋友群体之间的小额贷款 Alice and Bill要去吃午饭比尔的卡坏了所以爱丽丝支付了他的餐费 10 美元第二天Bill and Charl
JavaScript 中的埃拉托斯特尼筛法对大量数据无限运行

我一直在尝试写埃拉托斯特尼筛法 http en wikipedia org wiki Sieve of EratosthenesJavaScript 中的算法基本上我只是按照以下步骤操作创建从 2 到 n 1 的连续整数列表令第一个素
无法理解Peterson算法的正确性

我在这里讨论彼得森算法的一个场景 flag 0 0 flag 1 0 turn P0 flag 0 1 turn 1 while flag 1 1 turn 1 busy wait
在一个区域中拟合二维多边形的算法？

这有标准吗算法名称说我有 10 个不同大小的多边形我有一个特定大小的区域我想知道如何填充该区域中的最多多边形以及它们是如何拟合的笔记多边形可以根据限制集进行旋转一个可能的名称是包装问题 http en wikipedia
用于查找最近邻居的空间划分算法如何工作？

为了找到最近的邻居空间分区 http en wikipedia org wiki Nearest neighbor search Space partitioning是算法之一它是如何工作的假设我有一组 2D 点 x 和 y 坐标并
HTML5 数据库存储（SQL lite） - 几个问题

你好我在网上找不到足够的关于 HTML5 数据库存储使用示例 CRUD 的初学者资源我正在像这样打开创建我的数据库 var db document ready function try if window openDatabase
同时使用 GUID 和自动递增整数

我一直在研究使用 GUID 作为数据库中的主键到目前为止利似乎大于弊然而我发现 GUID 可能不是我想要的在我的应用程序中用户应该能够根据用户友好的 ID 来识别对象因此例如如果他们想要获取特定产品而不输入全名则可以使用
如何在首次运行时填充大型 SQLite 数据库

我正在开发一个基于 SQLite 数据库的字典应用程序该数据库包含超过 300 000 行问题在于最终形式的数据库文件由全文索引表组成并且重量远远超过150Mb 我通过创建无内容的 fts4 表设法将 db 文件大小降至最低数据库
调度算法，找到设定长度的所有非重叠区间

我需要为我的管理应用程序实现一种算法该算法将告诉我何时可以将任务分配给哪个用户我实现了一个蛮力解决方案它似乎有效但我想知道是否有更有效的方法来做到这一点为了简单起见我重写了算法以对数字列表进行操作而不是数据库查询等下面我将尝
如何停止在 mongodb 集合中插入重复文档

让我们有一个MongoDB包含三个文档的集合 db collection find id user A title Physics Bank Bank A id user A title Chemistry Bank Bank B id u
WordPress：wpdb->插入与wpdb->准备（wpdb->查询（“INSERT

我想知道 WordPress 的插入功能是否也向数据添加斜杠如果没有准备查询方法似乎可以更好地防止 SQL 注入我尝试在 codex api 中查找问题然而它似乎没有记录谢谢这个问题有点老了自从提出这个问题以来法典可能已经
有没有办法阻止 SQL Express 2008 空闲？

我使用 SQL Express 2008 作为 Web 应用程序的后端问题是 Web 应用程序是在工作时间使用的因此有时在午餐或休息时间如果 20 分钟内没有用户登录 SQL Express 将进入空闲状态模式并释放其缓存我知道这一
在 Hibernate 中创建 UPDATE RETURNING 查询

在 Oracle 中我们可以创建一个更新查询该查询将使用 RETURNING 子句返回更新的记录 Hibernate中有类似的功能吗除了数据库生成的值之外 Hibernate 显然不需要返回更新的实例因为对象传递给Session s
在 Python 中从 Excel 复制 YEARFRAC() 函数

因此我使用 python 来自动执行一些必须在 Excel 中执行的重复任务我需要做的计算之一需要使用yearfrac 这在Python中被复制了吗 I found this https lists oasis open org arc
从给定的项目列表创建子列表

我首先要说的是以下问题不是为了家庭作业目的即使因为我几个月前就完成了软件工程师的工作无论如何今天我正在工作一位朋友向我询问了这个奇怪的排序问题我有一个包含 1000 行的列表每行代表一个数字我想创建 10 个子列表每个子列表都
SQL 连接两个没有关系的表

我有具有相同结构的不同表我想通过其中一列将它们连接起来问题是他们不共享该专栏中的信息 Table 1 Type A Name Value Table 2 Type B Name Value 结果表在单列中 nameFromA name
无法在 Sqlite3 中添加默认值为 NULL 的 NOT NULL 列

尝试将 NOT NULL 列添加到现有表时出现以下错误为什么会发生这种情况我尝试了 rake db reset 认为现有记录是问题所在但即使重置数据库后问题仍然存在你能帮我解决这个问题吗迁移文件 class AddDivisio
如何实现n个元素的查找和插入操作的动态二分查找

这个想法是使用多个数组每个长度为 2 k 根据 n 的二进制表示来存储 n 个元素每个数组都是排序的不同的数组没有以任何方式排序在上述数据结构中 SEARCH是通过对每个数组进行一系列二分查找来进行的 INSERT 是通过一系列相同
通知设置的数据库设计

用户可以打开或关闭他的通知设置帐户用于通知例如更改帐户资料信息收到新消息等通知可以通过电子邮件或手机推送或短信发送用户可以只有 1 封电子邮件和多个手机设备有什么方法可以改进以下数据库设计或者您会采取不同的方式吗让我
有没有任何代码可以在android中设置壁纸而无需裁剪和缩放？

我正在创建一个画廊应用程序我的第一个应用程序这是我的代码 Bitmap bmd BitmapFactory decodeStream is try getApplicationContext setWallpaper bmd catch

随机推荐

xpath - 使用包含和通配符

我有以下内容并试图看看是否有更好的方法我知道可以使用starts with contains 来完成我正在使用 firefox 10 进行测试我相信它实现了 xpath 2 测试节点是 a a a 有没有办法使用通配符来获取 foo
在Python的imp中，“ImportError：没有名为...的冻结子模块”

我正在尝试编写一个脚本在目录中搜索具有给定名称的模块我想使用find modulePython的方法imp https docs python org 2 library imp html 但是我不太明白为什么以下不起作用我位于包含
Resharper 重命名字段

我的任务是对未使用我们当前的代码风格约定编写的遗留代码库进行一些重大修改这些更改足够广泛以至于我在开始之前进行了一些清理和重构有相当多的死代码困扰我的一件事是字段遵循 m FieldName 命名约定而我们现在使用 fieldNa
如何使用自定义 boost::log 格式化程序输出 TimeStamp 和 ThreadID 属性？

我正在使用自定义提升日志 http www boost org doc libs 1 61 0 libs log doc html index html用于对输出日志消息进行颜色编码的格式化程序但我无法找到添加的正确方法时间戳 and
日期验证的正则表达式帮助 - dd/mm/yyyy - PHP [重复]

这个问题在这里已经有答案了有人可以告诉我我的方法在这个正则表达式方面的错误吗 if preg match 0 9 1 2 0 9 1 2 0 9 4 POST date 0 echo error 基本上我希望每次都显示错误消息除非格式正
填充数据表时，datareader 比 dataset 更快吗？

哪个会更快 1 循环数据读取器并创建基于填充数据表的自定义行和列 2 或者创建一个 dataAdapter 对象并只是 Fill 一个数据表在动态创建数据表时数据读取器的性能是否仍然有效 DataAdapter 在底层使用 DataRe
使用 D3 时 IE11 不接受 SVG 高度和宽度

我正在使用以下内容来设置响应式 SVG outerHeight 400 outerWidth 600 var margin top 20 right 20 bottom 30 left 40 width outerWidth margin
Vue 组件 props 的默认值以及如何检查用户是否未设置该 prop？

1 如何在 Vue 2 中设置组件 prop 的默认值例如有一个简单的movies可以这样使用的组件
为什么在 Firefox 中 document.body == null 而在 Safari 中却不然

我尝试访问的页面出现问题colorbox http colorpowered com colorbox 一种 jQuery 的灯箱工作它显然不起作用因为document body being null在 FireFox 3 5 3 中
Java 排序函数

在java中 collections sort使用合并排序算法而不是快速排序但Arrays sort使用快速排序我不确定上述事实但我在互联网上发现了这一点例如在网站上代码牧场 http www coderanch com t 520
设置显示方向失败

我正在我的应用程序中打开前置摄像头第一次应用程序运行正常但是当我再次运行应用程序第二次第三次或第四次时它给了我异常java lang RuntimeException set display orientation failed 请
大数据地理热图（google）

我想绘制一个heat map in 谷歌地图显示出租车乘车分布一个城市的我绕过去了4000条数据乘坐出租车的起始位置纬度和经度这是我的一些脚本首先我设置了谷歌地图 var hongkong new google maps LatLn
如何从aspnet中的请求体读取原始xml

我需要我的HttpController接收原始 XML 并将其传递给遗留代码我试试这个 HttpPost Route xml public string Post FromForm XDocument xml return xml ToS
如何使表格单元格缩小宽度以仅适合其内容？

我希望表格具有 100 宽度但其中只有一列应该具有自由宽度例如 A B C 因此 A 列和 B 列的宽度应与其内容的宽度相匹配但 C 列的宽度应持续到表格结束好的我可以指定 A 和 B 的宽度以像素为单位但问题是这些列的内容的
空格键不适用于 Flutter Web 应用程序中 iPhone（Safari 和 Chrome）中的 TextField

我在 Firebase 上部署了一个 Flutter Web 应用程序在 Android 手机笔记本电脑 Macbook 上无论是在 Safari 还是 Chrome 上一切都工作正常但在 iOS 上在 TextField 中输
Android 屏幕锁定/解锁编程[重复]

这个问题在这里已经有答案了我正在开发一个应用程序其中我必须以编程方式锁定和解锁屏幕请帮忙我不知道如何开发这种支持每个版本的 Android 操作系统的功能开锁 KeyguardManager km KeyguardManager
为什么 git 报告分支包含提交，但该提交似乎尚未应用？

我有一个场景发生在一个正在积极开发的 Git 存储库上我正在尝试了解它是如何实现的设想我有功能分支FeatureA 文件中添加了一行file1 txt 提交到此分支并使用提交哈希推送到原点hash1 FeatureA随后并入maste
如何强制复制省略，为什么它不适用于已删除的复制构造函数？

我有一个不可复制的课程复制这个会有问题我想要保证它永远不会被复制所以我制作了它的复制构造函数deleted class A public A A const A delete A fun return A int main A a f
Android 模拟器完全放电 - 运行 telnet power 命令导致模拟器崩溃

晚上好朋友们我是android新手我的问题是当我启动模拟器时它显示电池为空消息为connect to charger 当我通过互联网搜索此内容时我发现使用 Telnet 命令我使用了以下命令 telnet localhost
对具有相同域的大量集合执行子集测试操作的最快方法

假设我们在某处存储了数万亿组数据这些集合中的每一个的域都是相同的它也是有限且离散的因此每个集合可以被存储为相对较短长度例如 1024 的位字段例如 0000100111 也就是说位字段中的位 X 指示项目 X 1024 个可能

对具有相同域的大量集合执行子集测试操作的最快方法

对具有相同域的大量集合执行子集测试操作的最快方法 的相关文章

随机推荐

热门标签

对具有相同域的大量集合执行子集测试操作的最快方法的相关文章