最快的 ArangoDB 朋友的朋友查询是多少（带计数）

2024-03-12

我正在尝试使用 ArangoDB 获取朋友的朋友列表。不仅仅是一个基本的朋友的朋友列表，我还想知道用户和朋友的朋友有多少个共同的朋友并对结果进行排序。经过多次尝试（重新）编写性能最佳的 AQL 查询，我最终得到的是：

LET friends = (
  FOR f IN GRAPH_NEIGHBORS('graph', @user, {"direction": "any", "includeData": true, "edgeExamples": { name: "FRIENDS_WITH"}})
  RETURN f._id
)

LET foafs = (FOR friend IN friends
  FOR foaf in GRAPH_NEIGHBORS('graph', friend, {"direction": "any", "includeData": true, "edgeExamples": { name: "FRIENDS_WITH"}})
    FILTER foaf._id != @user AND foaf._id NOT IN friends
    COLLECT foaf_result = foaf WITH COUNT INTO common_friend_count
    RETURN {
      user: foaf_result,
      common_friend_count: common_friend_count
    }
)
FOR foaf IN foafs
  SORT foaf.common_friend_count DESC
  RETURN foaf

不幸的是，性能没有我想要的那么好。与相同查询（和数据）的 Neo4j 版本相比，AQL 似乎慢了很多（5-10 倍）。

我想知道的是...我怎样才能改进我们的查询以使其性能更好？

我是核心开发人员之一ArangoDB并尝试优化您的查询。因为我没有你的dataset我只能说说我的测试dataset如果您能验证我的结果，我会很高兴。

首先，如果我正在跑步ArangoDB2.7，但在这种特殊情况下，我预计与 2.6 相比不会有重大性能差异。

In my dataset我可以在大约 7 秒内执行您的查询。第一个修复：在你的朋友声明中你使用includeData: true并且只返回_id. With includeData: false GRAPH_NEIGHBORS直接返回_id我们还可以在这里去掉子查询

LET friends = GRAPH_NEIGHBORS('graph', 
                              @user,
                              {"direction": "any",
                               "edgeExamples": { 
                                   name: "FRIENDS_WITH"
               }})

这在我的机器上将其降低到约 1.1 秒。所以我预计这会接近Neo4J的性能。

为什么这会产生如此大的影响？在内部我们首先找到_id值而不实际加载文档 JSON。在您的查询中，您不需要任何此类数据，因此我们可以安全地继续不打开它。

但现在真正的改进

您的查询采用“逻辑”方式，首先获取用户的邻居，然后找到他们的邻居，计算出现的频率foaf找到并对其进行排序。这必须在内存中建立完整的 foaf 网络并将其作为一个整体进行排序。

您还可以通过不同的方式进行操作： 1. 查找全部friends用户（仅_ids） 2. 查找全部foaf（完整文件） 3. 对于每个foaf找到所有foaf_friends (only _ids） 4. 求交集friends and foaf_friends并计算它们

这个查询会像这样：

LET fids = GRAPH_NEIGHBORS("graph",
                           @user,
                           {
                             "direction":"any",
                             "edgeExamples": {
                               "name": "FRIENDS_WITH"
                              }
                           }
                          )
FOR foaf IN GRAPH_NEIGHBORS("graph",
                            @user,
                            {
                              "minDepth": 2,
                              "maxDepth": 2,
                              "direction": "any",
                              "includeData": true,
                              "edgeExamples": {
                                "name": "FRIENDS_WITH"
                              }
                            }
                           )
  LET commonIds = GRAPH_NEIGHBORS("graph",
                                  foaf._id, {
                                    "direction": "any",
                                    "edgeExamples": {
                                      "name": "FRIENDS_WITH"
                                     }
                                  }
                                 )
  LET common_friend_count = LENGTH(INTERSECTION(fids, commonIds))
  SORT common_friend_count DESC
  RETURN {user: foaf, common_friend_count: common_friend_count}

在我的测试图中，执行时间约为 0.024 秒

所以这给了我一个速度提高 250 倍执行时间，我希望这比 Neo4j 中当前的查询更快，但因为我没有你的dataset我无法验证，如果你能验证并告诉我就好了。

最后一件事

随着edgeExamples: {name : "FRIENDS_WITH" }它与includeData，在这种情况下我们必须找到真正的边缘并研究它。如果您根据边的名称将边存储在单独的集合中，则可以避免这种情况。然后也删除edgeExamples。这将进一步提高性能（特别是在有很多边缘的情况下）。

Future

请继续关注我们的下一个版本，我们现在正在向 AQL 添加更多功能，这将使您的案例更容易查询，并且应该会进一步提升性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

最快的 ArangoDB 朋友的朋友查询是多少（带计数）的相关文章

IllegalStateException：必须将 Gremlin 服务器配置为使用 JanusGraphManager

Set
Neo4j如何避免超级节点

在我的 Neo4j 项目中我有Role and Permission代表用户角色和权限的实体每个User系统中的内容与适当的角色和权限集有关系 I think Role and Permission是某种超级节点从性能的角度来看它们将
Neo4j 嵌入式数据库在应用程序异常终止后挂起

我打算公开我的第一个基于 Neo4j 嵌入式数据库的应用程序但遇到了严重的阻塞问题这是我之前遇到的数据库删除问题有效清理Neo4j数据库 I use OS Windows 8 1 jdk1 8 0 51 neo4j version 2
Gremlin 简单路径查询，根据遇到的第一条边属性获取路径

示例图实际图图像请参见此处生成顶点的代码 graph addV organization property name CITI property type ORG property T id 1 property orgName CI
Cosmos DB - 图形 API - 导出 graphSON 并尝试使用迁移工具导入它

我在新图中插入了一些顶点和边我已将生成的 grapSON 保存在 json 文件中然后我尝试使用迁移工具将该 json 文件导入到新图表中它只起到了部分作用我有一个带有顶点的新图但它们没有这样的属性或边 id c39f435b 3
ArangoDB 分面搜索性能

我们正在评估 ArangoDB 在构面计算空间中的性能还有许多其他产品能够通过特殊的 API 或查询语言执行相同的操作马克逻辑方面 ElasticSearch 聚合 Solr 分面等我们知道 Arango 中没有特殊的 API 来显式
如何将 ArangoDB 嵌入桌面应用程序

我想在我的应用程序中嵌入一个图形数据库适用于 Windows Linux 和 MAC 我将搜索范围缩小到 ArangoDB 和 OrientDB 我能够让嵌入式 OrientDB 工作但我仍然想尝试 ArangoDB 来做出明智的决定
我的树形图的 Arangodb 自定义过滤器/访问者

我有一个带有两个边定义的图如下所示 isDepartment organisation gt organisation hasAccess user gt organisation 组织嵌套在树中无循环有多个顶级组织没有任何传入is
如何将 AQL 的所有结果合并到具有自定义属性的单个文档中

我有一个 AQL 查询遍历图它始终应从一组唯一的集合中返回固定数量的文档因此每个集合只会发生一次并且仅包含一个文档我希望将它们全部合并到反映文档集合名称的属性下的单个文档中查询很简单 FOR v IN ANY vertex key
Neo4j 合并和原子事务

我正在运行下面的MERGE从客户端应用程序在 10 个并行线程中查询我的 Neo4j 服务器 newFoo and id所有 10 次运行的参数均相同 MERGE foo Foo id id ON MATCH SET foo newFoo
Neo4j 数据库大小增长

我使用 neo4j 3 0 1 社区并且我有几 GB 的数据这些数据很快就会过时比如每天 2 3 次我必须先创建新数据然后删除旧数据因此在任何时间点都有一些数据可用问题是 Neo4j 不使用已删除节点关系中的空间我使用 M
Neo4J - 存储到关系与节点中

我想知道将数据存储到关系或节点中是否有任何优点或缺点例如如果我要将与讨论相关的评论存储到数据库中我应该将评论数据存储在评论关系中还是通过单独的关系存储在与讨论相关的评论节点中正确的数据模型取决于您需要进行的查询类型您应该
Gremlin 删除所有顶点

我知道如何在 Gremlin 中通过 id 删除顶点但现在我需要清理数据库如何删除多个顶点删除1v是这样的 ver g v 1 g removeVertex ver 我的意思是类似SQL的东西TRUNCATE 如何在不删除类的情况下删
使用 py2neo 在 neo4j 上查询写入性能

目前我正在努力寻找一种高性能的方法使用 py2neo 运行多个查询我的问题是 python 中有一大堆需要写入 neo4j 的写入查询我现在尝试了多种方法来解决这个问题对我来说最好的工作方法如下 from py2neo impor
将最短路径中的所有节点作为对象列表返回

我有以下 Cypher 查询它在 Neo4j 2 0 0 中运行良好 MATCH ab Point Latitude 24 96325 Longitude 67 11343 cd Point Latitude 24 95873 Longi
关系数据库和图数据库的比较

有人可以向我解释一下 MySQL 等关系数据库与 Neo4j 等图形数据库相比的优缺点吗在 SQL 中您有多个表它们之间有不同的 id 链接然后你必须加入来连接表从新手的角度来看为什么要将数据库设计为需要联接而不是像图形数据库
如何使用 ArangoJs 将文档存储在 ArangoDb 图中？

我正在使用 Nodejs 应用程序中的最新版本的 ArangoDb 和 ArangoJs 我有以下两个顶点 users tokens tokens顶点包含向其中一个用户发出的安全令牌users顶点我有一个名为的边缘定义token belo
ArangoDB 游标超时

使用 ArangoDB 2 3 1 看来我的光标将在几分钟内过期我希望它们能持续一个小时我已使用 TTL 参数设置 AQL 查询对象如下所示 query removed actual query count true batchSiz
远程连接 ArangoDB

我尝试从我的电脑连接到位于另一台服务器上的 ArangoDB 但似乎不成功然后我尝试使用通过输入服务器 IP 提供的 Web UI 来访问它http x x x x 8529 http x x x x 8529但也失败了我在本地主机 A
Neo4j：节点属性等于值 A 和值 B（交集）的求和关系属性

基本上我的问题是当存在属性等于值 A 和值 B 的相关节点时如何对关系属性求和例如我有一个简单的数据库具有以下关系 site HAS MEMBER gt user POSTED gt status TAGGED WITH gt t

随机推荐

定义后向对象添加属性？

我知道在 JavaScript 中您可以向现有类型例如 Date 的实例添加新属性但是是否可以在定义匿名类型的实例后向其添加新属性例如假设我有以下脚本 var employee Name Scott Age 32 JavaScri
如何在 Objective-C 中使用 NSRunLoop？

如何使用 Objective C 中的 NSRunLoop 并等待某个变量改变值 Thanks 我们通常不会在生产中使用 NSRunLoop 来等待变量更改可以使用回调然而在单元测试代码中我们确实有以下内容 NSDate twoSec
如何在 R 中标记多面图中的最大值点？

我读到有人有类似的问题 ggplot2 和facet grid 为每个图添加最高值 https stackoverflow com questions 41377236 ggplot2 and facet grid add highest
maven测试报告格式

当我在我的 Java Groovy Maven 项目中运行测试时测试报告存储在target surefire reports 对于运行的每个测试类 txt and xml创建文件显示该类的输出总而言之这是一种非常无用的格式因为它没有
R 不区分大小写的捕获组

这个正则表达式 str extract all This is a Test a z 返回 1 his is a est 如何修改使其不区分大小写 1 This is a Test 应该返回 Should i删除区分大小写 Trying s
如何为 PhraseQuery 搜索设置 Lucene 标准分析器？

Lucene 上的各种教程给我的印象是如果我这样做 IndexWriter writer new IndexWriter indexPath new StandardAnalyzer Version LUCENE CURRENT true
Delphi 中字符串和记录的常量就地数组

Delphi 可以实现这样的功能吗带有字符串和记录的动态数组 type TStringArray array of String TRecArray array of TMyRecord procedure DoSomethingWith
我如何将 -tabulator excel- 对象发送到服务器端（node.js）？

我可以成功将制表表导出到 Excel 并将其作为文件存储在本地计算机上但是我不知道如何将 Excel 对象发送到服务器在保存到本地计算机并将其发送到服务器端之前如何将制表器 Excel 转换为 Base64 我已经对 jsPdf 做了
在已部署的 Grails 应用程序上创建补丁的简单方法

我在我的客户端服务器计算机上的 tomcat6 上部署了 grails 应用程序但该应用程序仍然需要许多修复因此客户端计算机上发现的每个错误或缺少功能我创建一个补丁并通过 ftp 上的 tar gz 文件交付给客户端这将替换部署的文件
如何更改 Linux 中单个线程的名称？

我发现了这个帖子 https stackoverflow com questions 2369738 how to set the name of a thread in linux pthreads关于更改线程的名称我尝试过prctl
tensorflow.python.framework.errors_impl.UnknownError：无法重命名：输入/输出错误

当我应用tensorflow eager模式来训练分类器时我遇到了以下错误 Steps 151 Train loss is 0 00039766659028828144 learning rate is 0 009999999776482
HTML 页面中的 PHP，超级快速建议

在编码方面我不是天才但我通过谷歌搜索足以弄清楚事情我有一个简单的问题我有一个页面 index html events html 等我想添加以便它加载并执行 php 文件但是我不想将我的页面从 html 重命名为 php 才能执行
线性布局：如何填满屏幕的整个宽度？

我有以下布局文件它在相对布局内创建线性布局
使用自定义 CA 时 API 17 (JELLY_BEAN) 中的 SSLHandshakeException

我需要连接到我的服务器 APITLS v1 由 CA 签名的服务器证书不包含在旧版本的 Android 中所以我使用这个谷歌的文档 http developer android com training articles security
Python如何读取一行并将其拆分为多个整数

对于用空格制表符分隔的输入文件例如 1 2 3 4 5 6 7 8 9 如何读取该行并拆分整数然后保存到列表或元组中谢谢 data 1 2 3 4 5 6 7 8 9 data 1 2 3 4 5 6 7 8 9 一种方法是假设子列
如何安装/设置 TortoiseGit 以与 GitHub 配合使用

我刚刚安装了Git Windows 版 http msysgit github com 并通过 Cygwin 使用 SSH 创建了我的 SSH 密钥它似乎可以通过命令行和 Git For Windows GUI 运行但现在我想使用 To
SAF DocumentFile - 检查路径是否存在，而不在每个文件夹级别创建每个 DocumentFile

成像你想检查 folder subfolder subsubfolder test test txt 文件是否存在你可以执行以下操作 DocumentFile sdCard i have already retrieved the sd
如何在facet_grid中指定列或如何更改facet_wrap中的标签

我有大量数据系列我想使用小倍数来绘制它们 ggplot2 和的组合facet wrap做我想要的通常会产生一个漂亮的 6 x 6 面的小块这是一个更简单的版本问题是我对小面条中的标签没有足够的控制数据框中的列名称很短我希望保持这
iOS - NSJSONSerialization：无法将数据转换为字符周围的字符串

我在解析 JSON 时收到此错误 NSDictionary json NSJSONSerialization JSONObjectWithData data options NSJSONReadingMutableContainers er
最快的 ArangoDB 朋友的朋友查询是多少（带计数）

我正在尝试使用 ArangoDB 获取朋友的朋友列表不仅仅是一个基本的朋友的朋友列表我还想知道用户和朋友的朋友有多少个共同的朋友并对结果进行排序经过多次尝试重新编写性能最佳的 AQL 查询我最终得到的是 LET friends

最快的 ArangoDB 朋友的朋友查询是多少（带计数）

最快的 ArangoDB 朋友的朋友查询是多少（带计数） 的相关文章

随机推荐

热门标签

最快的 ArangoDB 朋友的朋友查询是多少（带计数）的相关文章