使用 py2neo 在 neo4j 上查询写入性能

2024-04-11

目前，我正在努力寻找一种高性能的方法，使用 py2neo 运行多个查询。我的问题是 python 中有一大堆需要写入 neo4j 的写入查询。

我现在尝试了多种方法来解决这个问题。对我来说最好的工作方法如下：

from py2neo import Graph
queries = ["create (n) return id(n)","create (n) return id(n)",...] ## list of queries
g = Graph()
t = graph.begin(autocommit=False)
for idx, q in enumerate(queries):
    t.run(q)
    if idx % 100 == 0:
        t.commit()
        t = graph.begin(autocommit=False)
t.commit()

编写查询仍然需要很长时间。我还尝试从 apoc 运行多次但没有成功，查询从未完成。我也尝试了自动提交的相同写入方法。有一个更好的方法吗？有没有什么技巧，比如先删除索引，然后在插入数据后添加索引？

-- 编辑：附加信息：

我正在使用 Neo4j 3.4、Py2neo v4 和 Python 3.7

您可能想阅读迈克尔·饥饿 (Michael Hunger) 的著作快速批量更新的提示和技巧 https://medium.com/neo4j/5-tips-tricks-for-fast-batched-updates-of-graph-structures-with-neo4j-and-cypher-73c7f693c8cc.

关键技巧是使用UNWIND https://neo4j.com/docs/developer-manual/current/cypher/clauses/unwind/将列表元素转换为行，然后逐行执行后续操作。

有一些支持功能可以轻松地为您创建列表，例如range() https://neo4j.com/docs/developer-manual/current/cypher/functions/list/#functions-range.

举个例子，如果你想创建 10k 个节点并添加一个 name 属性，然后返回节点名称及其图形 id，你可以这样做：

UNWIND range(1, 10000) as index
CREATE (n:Node {name:'Node ' + index})
RETURN n.name as name, id(n) as id

同样，如果您有大量数据要导入，则可以创建参数映射列表，调用查询，然后展开列表以立即对每个条目进行操作，类似于我们使用 LOAD CSV 处理 CSV 文件的方式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 py2neo 在 neo4j 上查询写入性能的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
ArangoDB：（1 个具有多个边缘定义的图）Vs（每个图 1 个边缘定义）

我想知道在一个图中拥有多个边定义与每个图都有一个边定义相比是否有任何优势谢谢你的帮助使用多个边缘定义而不是仅使用一个边缘定义有多种原因显示内容差异您可能需要不同的边缘集合bought and watched 不过这也可以通过使用标
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo

随机推荐

以最少的磁盘空间开销进行版本控制

我一直在考虑使用像 SVN 这样的版本控制系统作为我使用的几台 PC 之间的通用备份和同步工具这适用于各种数据包括 MP3 和翻录 DVD 大量数据 120GB 我的主要问题是 SVN 创建每个版本化文件的副本 svn目录虽然我可以看
如何使用List.fold_left？

我仍在尝试了解如何fold left完全有效它是否像这样迭代列表List iter 或者我的代码还有其他问题吗我认为 e 是列表中的元素所以它是一个元组并且fst e获取元组的第一个元素并且snd e获取元组中的第二个元素 let
如何将 JToken 转换为 string[]？

我正在尝试将 JObject 中的数组读取到 string 中但我不知道如何操作代码非常简单如下所示但不起作用失败并出现错误无法将 JToken 转换为 string JObject Items jsonSerializer De
NiFi：ExtractText 中的正则表达式获取 CSV 标头而不是数据

我正在开发一个获取 CSV 文件的流程我想根据 CSV 记录中的第一个字段将记录放入不同的目录中例如 CSV 文件看起来像这样 country firstname lastname ssn mob num US xxxx xxxxx x
如何使用其内容识别图像文件格式？

如果图像文件的格式为 png那么它将包含 PNG 位于文件的开头当读入Text mode 如果图像文件的格式为 bmp那么它将包含BM 位于文件的开头当读入Text mode 我知道图像格式在文件开头包含一定大小字节的文本数据这
无法安装kivy。为 kivy 构建轮子失败 (pyproject.toml)

我不知何故搞砸了我的 pip 或我的 kivy 文件我的也安装不了我试过了pip install kivy并且git clone https github com kivymd KivyMD git depth 1 我使用的是 macos
实时工作流程的自定义工作流程活动中缺少跟踪日志

我已经针对 CRM 2013 编写了一个自定义工作流活动您不需要了解它的作用我遇到的问题是尽管实例化了ITracingService 我使用生成的任何跟踪内容Trace 方法在运行时被混淆仅适用于实时工作流程换句话说如果我异步运行
如何从线性渐变中获取当前颜色？

我有一个搜索栏其值范围为 1 到 10 THUMB 停止在 1 2 3 4 5 10 如果 SeekBar 是线性渐变则背景颜色颜色从红色开始然后是黄色最后是绿色如何获取拇指所在位置的当前颜色 pskink的建议 https s
OAuth 2 承载授权标头

随着客户端 API 的更新 HTTPBasicAuthication 方法已替换为 OAuth2Bearer授权标头使用旧的 API 我会执行以下操作 NSURLCredential credential NSURLCredential
让 R 停止正在运行的 EC2 机器

我有一些工作流程我希望 R 在完成脚本后停止正在运行的 Linux 机器我可以想到两种类似的方法来做到这一点以 root 身份运行 R 然后调用system halt 从 root shell 脚本运行 R 可以以任何用户身份运行 R
指数时间复杂度的真实示例

我正在寻找一个直观的现实世界的问题示例该问题需要最坏情况指数时间复杂度来解决我正在做的演讲以下是我提出的其他时间复杂度的示例其中许多取自这个问题 https stackoverflow com questions 1592649
检查表单是否已提交 - PHP

检查表单是否已提交以确定是否应该将表单的变量传递给我的验证类的最佳方法是什么首先我想也许 isset POST 但这总是会返回 true 因为超全局变量在任何地方都被定义我不想使用以下方式迭代表单的每个元素 if isset POST
如何重现错误“由于暂停纯视频背景媒体以节省电量，播放（）请求被中断”？

介绍作为我项目的一部分我有一个接收视频流的播放器我希望它在流开始和结束时自动播放和自动停止因此我引入了一个检查来查看流是否处于活动状态并在每种情况下启动和或停止播放器这是一个企业网站有时有多达 3000 名用户同时观看视频流
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
java 的地理图表

谁能推荐一个 Java 组件它可以让您创建一个漂亮的世界地图图像突出显示某些国家基于一些统计数据与此图像类似的东西类似于 Google 地理图表但适用于 Java https developers google com char
Visual Studio Android ApkSigner 在密钥库中找不到密钥

我在 Visual Studio 中创建 APK 时收到此错误 Failed to load signer signer 1 C googleplay keystore entry googleplay does not contain a
使用pipenv，如何在pipfile中指定最低的python版本？

Pipenv 有没有办法在 Pipfile 中指定 python 的最低版本像这样的东西会起作用吗 requires python version gt python 3 5 No pipenv does not支持这一点每Pipenv
xcode 接口生成器对象链接到检查器中的自定义类？

在Xcode 最新版本 Interfacebuilder中您可以将对象链接到代码我创建了一个类 interface FileChangeController NSObject 但它没有在 Interface Builder Inspec
ios8 - 如何显示默认共享表

我想展示并使用默认的分享到其他服务表以便允许分享到 Twitter Facebook 电子邮件等我不知道如何从我的应用程序中显示此视图我该怎么做您可以使用简单的活动控制器来显示默认共享应用程序 NSArray activityI
使用 py2neo 在 neo4j 上查询写入性能

目前我正在努力寻找一种高性能的方法使用 py2neo 运行多个查询我的问题是 python 中有一大堆需要写入 neo4j 的写入查询我现在尝试了多种方法来解决这个问题对我来说最好的工作方法如下 from py2neo impor

使用 py2neo 在 neo4j 上查询写入性能

使用 py2neo 在 neo4j 上查询写入性能 的相关文章

随机推荐

热门标签

使用 py2neo 在 neo4j 上查询写入性能的相关文章