部分多键映射的数据结构？

2024-03-10

我的数据由映射到值的键组成，如下所示：

---------------------
Key          | Value
---------------------
(0, 0, 0, 0) | a
(0, 0, 0, 1) | b
(0, 1, 0, 1) | c
(0, 1, 1, 0) | d
....

我正在寻找一种可以有效地对键执行搜索查询的数据结构，其中查询可以是完整或部分指定键。例如：

(0, 0, 0, 1) -> a
(0, *, *, *) -> [a, b, c, d]
(0, 1, *, *) -> [c, d]

The idea that I've right now is to implement this using a regular tree, similar to this: tree Leaves nodes represent the values and non-leaves nodes are parts of the key (i.e. w,x,y and z nodes are first, second, third and forth part of the key, respectively.). A simple BFS algorithm could be used to answer any query. But the problem is that this tree is growing exponentially with each new part of the key.

什么数据结构/算法更适合解决这个问题？请注意，关键部分可以是数字或字符串。

数组。对真的！您将没有空间开销，没有“指针追逐”开销，并且计算索引只需要一点位数学，而处理器在这方面确实相当擅长。

假设您获得部分密钥作为mask and bits哪里的mask通配符位为 0，其他位为 1，并且bits通配符为 0，非通配符为任意值。

收集具有与该模式匹配的键的所有项目的算法是：

int key = bits;
do {
    yield items[key];
    key = (key | mask) + 1 & ~mask | bits;
} while (key != bits);

That key = (key | mask) + 1 & ~mask | bits这部分看起来很有趣，这就是它的工作原理。

The |（按位或）使所有非通配符为 1。这可确保增量继续携带非通配符的位。添加之后，本应“固定”的位被破坏（如果进位通过它们，则为 0，否则为 1），因此必须将它们屏蔽掉（& ~mask），然后设置回正确的值（| bits）。运算符的优先级使得它基本上可以在没有括号的情况下编写。您也可以将其写为

key = (((key | mask) + 1) & (~mask)) | bits;

这适用于任何类型的模式。如果您只需要“最后 x 位是可变的”，您可以进行一些优化：

int wildcards = 0;
int invmask = ~mask;
do {
    yield items[wildcards++ | bits];
} while (wildcards & invmask);

That just runs from 0 to 2^{number-of-wildcards} and then puts in the fixed bits in the top.

非二进制密钥

In the simplest non-binary case, the parts of the key are still some integral number of bits, that is, they range from 0 to 2ⁿ-1. You can use exactly the same code in that case, but the interpretation of the mask is different: instead of having a single 0 bit for a wildcard or a single 1 bit for a non-wildcard, it would have some other number of bits (corresponding to the width in bits of a key-part).

对于非二的幂，需要更多的技巧。问题在于，为了满足关键部分小于某个值的约束，必须比正常情况更早地生成进位。

例如，如果所有关键部分都可以是 0、1 或 2（但不能是 3），则可以执行以下操作（未测试）：

int key = bits;
int increment = (0x55555555 & ~mask) + 1;
do {
    yield items[key];
    int temp = (key | mask) + increment & ~mask;
    int fix = (temp | (temp >> 1)) & 0x55555555;
    key = temp - fix | bits;
} while (key != bits);

额外的increment是 1 加上“最接近的 2 次方与关键部分最大值之差”的掩码，在本例中，每个关键部分都是 1，因此每个“槽”（槽）中都有一个 1是 2 位宽，这是在这种情况下它们可以达到的最窄宽度）。它仅在通配符位置具有那些“偏移量”。

偏移关键部分，使其最高允许值映射到“全一”，确保进位通过它们传播。然而，这意味着它们通常处于无效状态（除非它接收到进位并变为零）。那么烦人的部分就来了：必须撤消偏移only对于没有归零的关键部分。

所以有fix它计算不为零的关键部分的掩码。如果关键部分更宽，那就更烦人了，如果关键部分的尺寸不一样，那就更糟糕了。

然后最后一部分，key = temp - fix | bits，撤消偏移并将非通配符放回原位。该减法不会破坏任何内容，因为仅从至少为 1 的 2 位组中减去 1，因此进位永远不会留下关键部分。

当然，这种索引方式确实浪费了一些空间，与二次幂的情况不同，因为数组中存在您永远无法索引的“洞”。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

datastructures

部分多键映射的数据结构？的相关文章

算法 - 如何有效删除列表中的重复元素？

有一个list L 它包含以下元素任意类型each 如何有效删除此类列表中的所有重复元素必须保留订单只需要一个算法因此不允许导入任何外部库相关问题在Python中从列表中删除重复项以使所有元素都是唯一的最快算法是什么在维持秩序的
Dijkstra 算法不生成最短路径？

我正在使用 Dijkstra 算法解决最短路径问题我遇到了麻烦因为该算法应该提供最短路径但运行该算法后我手动得到了一条短路路径这只是该算法的副产品吗我尝试生成的路径是从 a gt z 这是我通过应用该算法得到的路径在我访问的每
所有可能的骑士在普罗梅拉的棋盘上移动

是否有可能用马从初始位置 I J 绕过大小为 N N 的棋盘并且只访问每个方格一次 define A True A I J false active proctype method bit I 4 bit J 3 bit K 1 bit
用于基本要素匹配的最坏情况 NlogN 算法

查找两个相同大小数组的元素之间的唯一映射 https stackoverflow com questions 4411940 find the unique mapping between elements of two same size
识别鼠标移动的算法

我想知道是否有任何研究算法可以指定鼠标在识别等字符时的偏差量使用鼠标绘制某种光学字符识别但可能是一个更简单的版本是否有某种算法可以让我说用户绘制的问号确实是一个问号而不是其他具有一定准确性的东西就像 Windows 平板电脑软
Python 中的空填字游戏求解器

我得到了一个包含填字游戏蓝图的矩阵当然它是空的我们的目标是填补整个难题这是 Checkio 的一项任务我已经为此奋斗了相当长一段时间根据我对复杂性的理解这个问题没有完美的算法不过必须有最好的方法来做到这一点对吧我尝试了
用ast重写代码； Python

我正在学习 AST 它看起来很强大但我很困惑代码去了哪里以及为什么它消失了说我想重写 example def fake x n y useless list n return x as example def fake x n retu
当平方和为N时，如何找到四个变量的所有可能值？

A 2 B 2 C 2 D 2 N给定一个整数N 打印出整数值的所有可能组合ABCD求解方程我猜我们可以比暴力做得更好天真的暴力会是这样的 n 3200724 lim sqrt n 1 for a 0 a lt lim a for b
神经网络的层和神经元

我想更多地了解神经网络我正在开发一个 C 程序来制作神经网络但我坚持使用反向传播算法很抱歉没有提供一些工作代码我知道有很多库可以用多种语言创建神经网络但我更喜欢自己制作一个关键是我不知道要实现特定目标例如模式识别或函数近似或其
处理流星中的长服务器端计算

我正在使用 jimp https www npmjs com package jimp https www npmjs com package jimp 在meteor JS中生成图像服务器端换句话说我正在使用递归算法计算图像的像素
查找文本中所有关键字的有效算法

我有很多字符串其中包含许多不同拼写的文本我通过搜索关键字来标记这些字符串如果找到关键字我将使用该关键字的关联文本假设搜索字符串可以包含文本 schw schwa 和施瓦茨我有三个关键字全部解析为文本 schwarz 现在我正
线段树java实现[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案你知道二进制的良好实现吗线段树 http en wikipedia org wiki Segmen
简单的排名算法

我需要创建一个民意调查按照项目的好坏顺序创建一个排名列表我打算向每个用户展示两个项目让他们选择一个他们认为更好的项目然后多次重复这个过程它有点类似于您在社交网络电影我应该如何根据收到的答案对项目进行排名看着那这ELO国际象棋
关于Marching Cubes算法的澄清

关于Marching Cubes 我对其算法和实现有一些疑问我已经阅读了 Marching Cubes 的 Paul Bourke 优秀文章以及网站上可用的源代码但是我在理解以及如何以自己的方式实现算法方面仍然遇到了一些问题问题如下
什么是“朴素”算法，什么是“封闭式”解决方案？

我有一些关于描述算法时使用的术语语义的问题首先朴素算法是什么意思这与给定问题的其他解决方案有何不同解决方案还可以采取哪些其他形式其次我听到很多人提到封闭式解决方案我也不知道这意味着什么但在尝试解决递归关系时经常会出现
如何求两个地点的经纬度距离？

我有一组位置的纬度和经度怎么找distance从集合中的一个位置到另一个位置有公式吗半正矢公式假定地球是球形的然而地球的形状更为复杂扁球体模型会给出更好的结果如果需要这样的精度你应该更好地使用文森特逆公式 See http
坐标算法 - 绕中心旋转

通过查看这张图片我想您会很好地理解我的问题图片已删除网址不再有效现在返回广告所以基本上我想要一个函数它接受一个对象作为参数并根据我之前添加的对象数量为该对象提供正确的坐标假设我将所有这些对象添加到一个数组中 objectAr
heapq.nlargest 的时间复杂度是多少？

我在看演讲者说获得t列表中最大的元素n元素可以在O t n 这怎么可能我的理解是创建堆将是O n 但是复杂度是多少nlargest本身就是O n t or O t 实际的算法是什么在这种情况下说话者是错误的实际成本是O n log
求先递增后递减列表的最大值和最小值

我尝试用谷歌搜索这个问题但没有取得太大成功我确信这个问题或类似问题有一个技术名称但我似乎找不到答案给定一个列表L整数即严格递增然后严格递减找到该列表的最大值和最小值例如 L可能 1 2 3 4 5 4 3 2 or 2 4
如何计算 3D Morton 数（交织 3 个整数的位）

我正在寻找一种快速计算 3D Morton 数的方法这个网站 http www graphics stanford edu seander bithacks html InterleaveBMN有一个基于幻数的技巧来处理 2D Morto

随机推荐

Quarkus 替代 spring-data-jdbc

默认DAO层 ORM框架中Quarkus is Panache 在 Hibernate 之上这很奇怪因为我没有找到任何可插入外部 L2 缓存实现如 Redis 的内置集成夸库斯被称为cloud native但在实际系统中使用默认的
如何使用 cURL 在 php 中发布表单数据？

我有以下命令它使用 form F 选项我知道它正在工作 curl form file home USERNAME import csv https apiprovider com api v0 imports token KEY 我需要
mongodb聚合获取数组中负序的最大数量

我需要通过聚合从数组中获取负序列的最大计数示例文档 id 1 x 1 1 1 1 1 1 1 1 1 1 1 id 2 x 1 1 1 1 1 1 1 预期结果 id 1 x 4 id 2 x 2 请指教您可以使用 reduce htt
如何为 Cloudfront 上的静态托管网站的子目录设置默认根对象？

如何为 Cloudfront 上静态托管网站上的子目录设置默认根对象具体来说我想www example com subdir index html每当用户请求时提供服务www example com subdir 请注意这是为了交付保
quartz：xml 文件的文档？

quartz xml 文件特别是 jobs xml 的文档在哪里我找到了javadoc http www quartz scheduler org docs api index html在线但我似乎找不到如何编写 xml 文件的文档
如何在 sed 中转义斜杠、双引号和单引号？

据我所知当您使用单引号时里面的所有内容都被视为文字我想要那个来代替我但我也想找到一个带有单引号或双引号的字符串例如 sed i s http www fubar com URL FUBAR g 我想用 URL FUBAR 替换 h
Oracle 查询 - 仅获取选择字段中的字符串

也许这听起来有点疯狂但我需要提出一个查询来仅检索字母数字字段中的字母例如 TABLE 1234ADD 3901AC 1812OPA82711AUU 预期结果 ADD AC OPA AUU 谢谢你看起来您只想删除数字您可以使用REGE
无法在 Android 上使用 AlarmManager 安排通知（使用 Qt）

我正在 qt 5 5 中执行以下操作项目我正在尝试使用 android 中的警报管理器安排本地通知这是安排通知的代码 class ScheduledNotifications static public int notificatio
是否可以让 Visual Studio 或 Resharper 用不同的颜色突出显示枚举？

我认为如果用与类属性不同的颜色突出显示枚举属性代码会更具可读性对于 VS2010 VS2013 VS2015 VS2017 VS2019 工具 gt 选项 gt 环境 gt 字体和颜色显示文本编辑器的设置显示项目用户类型枚举更
如何提取 Tidymodels 生成的 GLMNET 系数

我估计了一个glmnet逻辑回归使用整洁的模型但我无法弄清楚有两件事是密切相关的整洁的模型 a 如何提取估计系数 b 保存估计模型以供将来生产使用以下是伪模型的代码我试过tidy coef and predict 但他们都失败了任
javamail还提取封装消息的附件内容类型：message/rfc822

我想提取封装在消息 InputStream 中的 eml 消息的所有附件内容类型 message rfc822 InputStream is new FileInputStream Path MimeMessage mime new Mi
双重修改后如何继续合并？

我在用着git rebase i重写历史记录在这种情况下对早期提交的更改集进行小的更改换句话说 A B C master gt A B C master I know C也在隐含地改变但你明白了这是我迄今为止的进展 git reb
Eclipse Neon.1 泛型编译错误：无法推断类型参数

MWE https www wikiwand com en Minimal Working Example import java util Comparator import java util TreeMap import static
Ruby 的 watchr 在 Python 中相当于什么？

我喜欢这个概念watchr https github com mynyml watchr 它监视文件系统并在发生变化时运行回调有纯Python 的等价物吗最好可以 pip 安装你可能应该看看看门狗 http packages pyth
如何在这个系统内进行通信？

我们打算设计一个具有三个层的系统总部只有一台服务器区域上有很多节点使用 iPad 的用户 HQ 与节点进行 2 路通信节点与用户进行 2 路通信用户从不与总部沟通反之亦然权力机构规定总部的 Windows 应用程序使
使用样式在主题中设置活动背景？

我想在我的所有活动中使用背景绘制我怎样才能用一种风格做到这一点 styles xml 它为所有小部件设置了背景我只是希望它能够用于活动 Thanks Use
如何查找某个项目在列表中第n次出现的索引？

Given x w e s s s z z s 每次出现s出现在以下索引中 1st 2 2nd 3 3rd 4第四名 7 If I do x index s 我将得到第一个索引如何获得第四个的索引s Using 列表理解 http doc
如何处理RecyclerView.ItemDecoration中的点击事件？

我有一个 RecyclerView 带有 LinearLayoutManager 和一个自定义的 RecyclerView ItemDecoration 比方说我想在装饰视图中添加按钮出于某种原因我用按钮填充布局它正确绘制但我无法
为什么 getLocationOnScreen(location) 总是返回 0？

In my FragmentLayout我有一个LinearLayout具有多个子视图 TextView CardView 我想找到所有的顶部偏移量LinearLayout意见但我总是得到零这是我的代码 Override public V
部分多键映射的数据结构？

我的数据由映射到值的键组成如下所示 Key Value 0 0 0 0 a 0 0 0 1 b 0 1 0 1 c 0 1 1 0 d 我正在寻找一种可以有效地对键执行搜索查询的数据结构其中查询可以是完整或部分指定键例如 0 0 0

部分多键映射的数据结构？

非二进制密钥

部分多键映射的数据结构？ 的相关文章

随机推荐

热门标签

部分多键映射的数据结构？的相关文章