如何使用 Gremlin 提高最短路径的性能？

2023-12-02

我正在使用 JanusGraph 和 Gremlin 以及this数据集包含 2.6k 个节点和 6.6k 个边（两侧各 3.3k 个边）。我已经运行查询 10 分钟但没有找到最短路径。

使用 Gephi，最短路径几乎是瞬时的。

这是我的查询：

g.V(687).repeat(out().simplePath()).until(hasId(1343)).path().limit(1)

With simplePath()您的查询仍然处理比必要的更多的路径。例如，如果688是直接邻居687，而且也是邻居1000，与另一条路径相距 10 跳，为什么您要遵循从1000 to 688，您是否很早就见过这个十字路口？

因此，您应该过滤掉以前见过的任何十字路口（第一次出现的总是最接近的）：

g.V(687).store('x').
  repeat(out().where(without('x')).aggregate('x')).
   until(hasId(1343)).limit(1).path()

另请注意，我交换了limit(1) and path;这是因为首先收集所有路径然后只采用第一个路径会浪费资源（CPU 和内存）。

UPDATE:

如果其他人想尝试一下，这里是将数据集加载到 TinkerGraph 中的代码：

g = TinkerGraph.open().traversal()
"http://nrvis.com/download/data/road/road-minnesota.zip".toURL().withInputStream {
  new java.util.zip.ZipInputStream(it).with {
    while (entry = it.getNextEntry()) {
      if ("road-minnesota.mtx" == entry.getName()) {
        it.eachLine {
          if (it ==~ /[0-9]+ [0-9]+/) {
            def (a, b) = it.split()*.toInteger()
            g.V(a).fold().
              coalesce(unfold(), addV().property(id, a)).
              addE("road").
                to(V(b).fold().coalesce(unfold(), addV().property(id, b))).inV().
              addE("road").to(V(a)).iterate()
          }
        }
        break
      }
      it.closeEntry()
    }
  }
}

以及查询和一点基准：

gremlin> g.V(687).store('x').
......1>   repeat(out().where(without('x')).aggregate('x')).
......2>    until(hasId(1343)).limit(1).
......3>   path().by(id)
==>[687,689,686,677,676,675,673,626,610,606,607,608,735,732,733,730,729,734,737,738,739,742,786,816,840,829,815,825,865,895,872,874,968,983,1009,1044,1140,1142,1148,1219,1255,1329,1337,1339,1348,1343]

gremlin> clock (100) {
......1>   g.V(687).store('x').
......2>     repeat(out().where(without('x')).aggregate('x')).
......3>      until(hasId(1343)).limit(1).
......4>     path().iterate()
......5> }
==>12.5362714

TinkerGraph 上的 12.5 毫秒对我来说看起来相当不错。预计 JG 上的运行时间会长一点，但肯定不会超过 10 分钟。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Graph

cassandra

shortestpath

Gremlin

janusgraph

如何使用 Gremlin 提高最短路径的性能？的相关文章

加权图的 BFS 算法 - 寻找最短距离

我看过很多帖子即 post1 https stackoverflow com questions 30409493 using bfs for weighted graphs post2 https cs stackexchange co
适用于 AWS 区域的 Cassandra Ec2MultiRegionSnitch 或 GossipingPropertyFileSnitch

我们在美国 AWS 区域有 3 个 Cassandra 节点在新加坡 AWS 区域有 3 个节点如果我必须构建多数据中心我们是否必须使用 Ec2MultiRegionSnitch 或者我们可以使用 GossipingPropertyF
使用 matplotlib.animation 从 CSV 文件实时绘图 - 数据绘制到第一个输入错误

我正在尝试绘制来自不断写入 CSV 文件的传感器的数据虽然成功创建实时绘图但每个新数据条目都会创建一条延伸到第一个数据条目的附加线见下文 Python 3 4 脚本 import matplotlib pyplot as plt im
Cassandra Nodetool Repair 的具体作用是什么？

From http docs datastax com en cassandra 2 0 cassandra operations ops repair nodes c html http docs datastax com en cass
我可以在 Cassandra 2.1 中对集合进行多重查询吗？

在 Cassandra 2 1 中我们可以通过在列上创建二级索引来查询集合 cqlsh play gt select from songs where tags contains t1 id tags title e99f8f30 d21
为什么我的 Python 散点图不起作用？

我使用 pylab 创建了一个非常简单的散点图 pylab scatter engineSize fuelMile pylab show 该程序的其余部分不值得发布因为正是该行给我带来了问题当我将散点更改为绘图时它会绘制数据图
性能 - TTL 与在 Cassandra 中删除一行

我们有大量数据写入 cassandra 中的数百万行我们还有一个调度程序需要处理这些记录并在处理成功后将其删除想知道处理后删除行还是用 TTL 标记行本质上是延迟删除 Deletion 与 TTL 对于 Cassandra 性能有何
用于图形操作的 Javascript 库

有没有建议的 javascript 替代 pythonpygraph http code google com p python graph or NetworkX http networkx lanl gov 应该注意的是可视化不是必需
Flot 0.8.2 折线图 - 颜色错误

我正在使用 Flot 折线图并设置它们的颜色我发现了一个奇怪的错误在前 3 种颜色之后绘图对所有其他线条使用最后一种颜色这不是正确的行为更有趣的是图例显示了正确的颜色这是一个已知的错误 var dataSet label d1
根据统计数据获取cassandra中的数据点

我正在测试 Cassandra 2 0 作为存储时间序列数据的可能替代品我制作了一个简单的表并将一些数据转储到其中 CREATE TABLE DataRaw channelId int sampleTime timestamp value
Elasticsearch 与 Cassandra 对比 Elasticsearch 与 Cassandra

我正在学习 NoSQL 并正在寻找满足客户要求之一的不同选项在提出这个问题之前我已经查阅了各种资源一个对NoSQL知之甚少的人我需要以更快的速度存储数据并读取数据完全故障安全且易于扩展能够搜索数据进行分析我最终得到了一个简短的清
Cassandra 查询失败（墓碑）

所以这让我发疯我尝试查询 Cassandra 中的一张表结果显示查询失败我尝试深入探究其背后的原因发现这是因为墓碑我将 GC GRACE SECONDS 更改为零并使用 nodetool 触发了压缩当我再次查询时它工作正常然而
计算 Adamic-Adar 的快速算法

我正在研究图形分析我想计算一个 N N 相似度矩阵其中包含每两个顶点之间的 Adamic Adar 相似度为了概述 Adamic Adar 让我从以下介绍开始给定邻接矩阵A无向图的G CN是两个顶点的所有公共邻居的集合x y 两个顶
Python 3.x 中的绘图

在Python 2 6中我使用matplotlib制作了一些简单的图表但是它与 Python 3 1 不兼容有哪些替代模块可以完成相同的事情而不非常复杂您说您想创建一些简单的图表但没有真正说明您想要多简单或哪种类型的图表只要它
为什么从 Cassandra CLI 教程中进行剪切和粘贴不起作用？

盲目跟风http wiki apache org cassandra Cas sandraCli http wiki apache org cassandra CassandraCli 有人可以解释一下吗 aaron mac apache
如何使 R barplot 上的列标签变为斜体

这可能是一个简单的问题但是如何仅将条形图上的列标签设为斜体而不是斜体x axis标签但列标签是专门的到目前为止我的代码是 bp barplot means names arg c CON TRI ylim c 0 120 ylab
float：使所有 Y 轴的刻度线对齐

我有一个流程图除了第一个 Y 轴之外还使用具有不同数字刻度的辅助 Y 轴我的问题是辅助刻度标签与第一个浮动轴制作的网格线不对齐 Flot 似乎正在运行一些内部算法来决定为轴显示多少个刻度标签它对每个轴分别执行此操作从而产生了我遇到
如何使用 DataStax java 驱动程序增加 cassandra 中的每秒事务数 (TPS)

设置 2 节点 Cassandra 2 0 7 31 集群副本 1 DataStax java 驱动程序 2 0 Problem 我正在使用 Datastax java 驱动程序进行负载平衡我并通过 Jmeter 生成 50000 线程
如何在 MATLAB 中绘制 3D 曲面图？

我有一个像这样的数据集 0 1 0 2 0 3 0 4 1 10 11 12 13 2 11 12 13 14 3 12 13 14 15 4 13 14 15 16 我想在 matlab 中绘制 3D 曲面图使列标题位于 y 轴行标题
Cassandra java驱动程序协议版本和连接限制不匹配

我使用的java驱动程序版本 2 1 4卡桑德拉版本 dsc cassandra 2 1 10cql 的输出给出以下内容 cqlsh 5 0 1 Cassandra 2 1 10 CQL spec 3 2 1 Native protocol

随机推荐

序列化 XmlDocument 并通过 HTTPWebRequest 发送

我试图弄清楚如何正确序列化我的 XmlDocument 并通过 HTTPWebRequest 对象发送它这是我到目前为止所拥有的 Stream requestStream HttpWebRequest request HttpWebReq
通过指针枚举 NSString 字符

如何通过从中提取每个 unichar 来枚举 NSString 我可以使用characterAtIndex 但这比通过递增unichar 慢我在苹果的文档中没有看到任何不需要将字符串复制到第二个缓冲区的内容像这样的东西将是理想的 for
在java中监视目录和子目录的创建、修改和更改

我已经编写了一些代码来检测目录 C java newfolder 中的更改它运行良好我已经在下面给出了 import java nio file import java util List public class DirectoryW
如何使用友元函数在模板类之外重载运算符==？

我正在尝试编写一个重载的模板类运算符我知道如何在课堂上得到它 template
从分层对象存储读取/写入到分层对象存储 - SharePoint 2007

我创建了一个自定义计时器作业需要一些配置才能运行我正在尝试将配置另存为SPPersistedObject在分层对象存储中分层对象存储保存在 SharePoint 配置数据库中因此我在尝试使用SPWebApplication作为家长
默认字符串排序顺序

默认排序顺序是实现细节吗或者如何选择默认比较器这让我想起了建议不要将哈希码存储在数据库中下面的代码是否保证以相同的顺序对字符串进行排序 string randomStrings Hello There World The Secre
Nginx 从多部分/表单数据中删除内容

我有两个 Nodejs 应用程序位于 nginx 反向代理后面这是我的 nginx 配置 main api location proxy pass http localhost 3000 chat api location socket
如何使用 Facebook 的 API 获取 Facebook 上共同好友的列表？

我正在尝试获取我自己和另一个用户的共同朋友列表但我在文档中找到的 API 都不起作用要么我收到一些奇怪的权限错误我只能获取我的朋友列表而没有其他用户要么我收到以下错误 Fatal error Call to a member fun
吉特。如何使用已更改的文件创建存档？

保持文件结构例如git archive git archive将文件路径作为参数因此您可以执行以下操作 git diff name status commit1 commit2 awk if 1 D print 2 xargs git
如何让 Rails 返回具有正确数据类型而不是字符串的 SUM(columnName) 属性？

假设以下形式的查询 operatingExpenses Expense find all select gt categories activityType categories name heading sum amount totalA
我应该使用 CSS :disabled 伪类还是 [disabled] 属性选择器还是这是一个意见问题？

我正在尝试设置禁用输入的样式我可以用 myInput disabled or myInput disabled 属性选择器是现代 CSS3 方式以及未来的发展方向吗我曾经使用伪类但我找不到任何关于它们是否是旧方式并且不受支持或者它们是
如何在Python Selenium中逐步向下滚动

大家好我是 Selenium 和 Python 的新手我只是在抓取网站帕加尔盖网站我知道如何向下滚动到页面底部但我需要的是逐步向下滚动以便 Selenium 单击所有阅读更多按钮但我不知道如何像这样逐步向下滚动所以我像下面
使用 geom_tile 清理地图

感谢本网站上一些用户的帮助我能够使用 geom point 获得一些数据的漂亮地图获得州界的边界但是现在我正在尝试清理它因为我有更多年的时间来绘制并希望确保情节正常工作并提供良好的信息经过进一步的研究似乎 geom tile
检查数据库中表是否存在时出现问题

基本上我有我的 MySQL dbname test 和我的表名称 page 我想使用 php PDO 创建一个查询来检查表 page 是否存在于我的数据库 test 中我已经尝试过这两件事但它确实有效第一个例子总是告诉我它不存在即使
在 JSP 中使用 struts 2 比较日期

我想使用比较两个日期Struts2 One is returned from the backend test currentDate 2012 11 15 The other one I just set 2014 10 19 我如何比较
move_uploaded_file(...): 无法打开流: 没有这样的文件或目录

我尝试使用 PHP 和 MySQL 以及临时文件夹将图像插入数据库中我使用 laravel 这是我的控制器 if isset FILES img masc img FILES img masc name ruta FILES img ma
使用 Python 的 matplotlib 3D API 绘制轮廓的问题

我正在尝试做类似的事情this文档中的 3D 示例但使用点云而不是光滑表面该示例将 2D 轮廓投影到三个坐标平面中的每一个上这表明我能够在 xy 平面上做到这一点当我尝试在其他两个平面上做同样的事情时我得到的要么是一个奇怪的轮廓塌
JWT 身份验证，Authorize 属性中定义的角色将被忽略

在努力实施的同时基于角色的身份验证 using JWT作为默认身份验证方案我遇到了一种情况其中定义的角色Authorize属性被忽略允许任何请求使用有效的令牌通过即使不在这些角色中有趣的是具有相同定义的自定义要求的其他策略A
给定并行列表，如何对一个列表进行排序，同时以相同的方式排列（重新排列）另一个列表？

假设我有 list1 3 2 4 1 1 list2 three two four one one2 Calling list1 sort 将对它进行排序结果是 1 1 2 3 4 然而我能得到list2与此同步重新排列以获得这样的结
如何使用 Gremlin 提高最短路径的性能？

我正在使用 JanusGraph 和 Gremlin 以及this数据集包含 2 6k 个节点和 6 6k 个边两侧各 3 3k 个边我已经运行查询 10 分钟但没有找到最短路径使用 Gephi 最短路径几乎是瞬时的这是我的查询 g

如何使用 Gremlin 提高最短路径的性能？

如何使用 Gremlin 提高最短路径的性能？ 的相关文章

随机推荐

热门标签

如何使用 Gremlin 提高最短路径的性能？的相关文章