在 NetworkX 中合并两个加权图

2024-01-01

我使用 python 多重处理来创建多个不同的 NetworkX 图，然后使用下面的函数来组合这些图。然而，虽然这个函数对于小图工作得很好，但对于较大的图，它会使用大量内存，并且会挂在我的系统和内存密集型 AWS 系统上（仅使用系统中总内存的大约三分之一）。有没有更有效的方法来执行以下功能？

def combine_graphs(graph1, graph2, graph2_weight = 1):
    '''
    Given two graphs of different edge (but same node) structure (and the same type),
    combine the two graphs, summing all edge attributes and multiplying the second one's
    attributes by the desired weights. 

    E.g. if graph1.edge[a][b] = {'a': 1, 'b':2} and 
    graph2.edge[a][b] = {'a': 3, 'c': 4}, 
    with a weight of 1 the final graph edge should be 
    final_graph.edge[a][b] = {'a': 4, 'b': 2, 'c': 4} and with a weight 
    of .5 the final graph edge should be {'a': 2.5, 'b': 2, 'c': 2}.

    Inputs: Two graphs to be combined and a weight to give to the second graph
    '''

    if type(graph1) != type(graph2) or len(set(graph2.nodes()) - set(graph1.nodes())) > 0:
        raise Exception('Graphs must have the same type and graph 2 cannot have nodes that graph 1 does not have.')

    # make a copy of the new graph to ensure that it doesn't change
    new_graph = graph1.copy()

    # iterate over graph2's edges, adding them to graph1
    for node1, node2 in graph2.edges():
        # if that edge already exists, now iterate over the attributes
        if new_graph.has_edge(node1, node2):
            for attr in graph2.edge[node1][node2]:
                # if that attribute exists, sum the values, otherwise, simply copy attrs
                if new_graph.edge[node1][node2].get(attr) is not None:
                    # try adding weighted value: if it fails, it's probably not numeric so add the full value (the only other option is a list)
                    try:
                        new_graph.edge[node1][node2][attr] += graph2.edge[node1][node2][attr] * graph2_weight
                    except:
                        new_graph.edge[node1][node2][attr] += graph2.edge[node1][node2][attr]
                else:
                    try:
                        new_graph.edge[node1][node2][attr] = graph2.edge[node1][node2][attr] * graph2_weight
                    except:
                        new_graph.edge[node1][node2][attr] = graph2.edge[node1][node2][attr]

        # otherwise, add the new edge with all its atributes -- first, iterate through those attributes to weight them
        else:
            attr_dict = graph2.edge[node1][node2]
            for item in attr_dict:
                try:
                    attr_dict[item] = attr_dict[item] * graph2_weight
                except:
                    continue
            new_graph.add_edge(node1, node2, attr_dict = attr_dict)

    return new_graph

代码中有两个地方会扩展内存：

1）复制graph1（也许你需要保留一份副本）

2）使用graph2.edges()创建内存中所有边的列表，graph2.edges_iter()迭代边而不创建新列表

您也可以通过以不同方式处理边缘数据来使其更快。您可以在迭代边缘时获取数据对象，而不必执行字典查找：

def combined_graphs_edges(G, H, weight = 1.0):
    for u,v,hdata in H.edges_iter(data=True):
        # multply attributes of H by weight
        attr = dict( (key, value*weight) for key,value in hdata.items())
        # get data from G or use empty dict if no edge in G
        gdata = G[u].get(v,{})
        # add data from g
        # sum shared items
        shared = set(gdata) & set(hdata)
        attr.update(dict((key, attr[key] + gdata[key]) for key in shared))
        # non shared items
        non_shared = set(gdata) - set(hdata)
        attr.update(dict((key, gdata[key]) for key in non_shared))
        yield u,v,attr
    return


if __name__ == '__main__':
    import networkx as nx
    G = nx.Graph([('a','b', {'a': 1, 'b':2})])
    H = nx.Graph([('a','b', {'a': 3, 'c':4})])
    print list(combined_graphs_edges(G,H,weight=0.5))
    # or to make a new graph 
    graph = G.copy()
    graph.add_edges_from(combined_graphs_edges(G,H,weight=0.5))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

networkx

在 NetworkX 中合并两个加权图的相关文章

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表所以我希望输出看起来像这样 Database Table name Database1 Table 1 Database1 Table 2 Database1 Table
无法“安装”plpython3u - postgresql

我正在尝试在 postgresql 中使用 python 语言像这样的事情 create or replace function test a integer returns integer as if a 2 0 return even
使用 psycopg2 在 python 中执行查询时出现“编程错误：语法错误位于或附近”

我正在运行 Python v 2 7 和 psycopg2 v 2 5 我有一个 postgresql 数据库函数它将 SQL 查询作为文本字段返回我使用以下代码来调用该函数并从文本字段中提取查询 cur2 execute SELECT
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
IO 密集型任务中的 Python 多线程

建议仅在 IO 密集型任务中使用 Python 多线程因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权然而多线程对于 IO 密集型操作有意义吗 https stackoverflow c
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

在整个解决方案的调试版本中禁用 Postsharp

我有一个包含许多项目的解决方案我想禁用 Postsharp 进行调试构建以减少本地开发人员的构建时间有没有办法在不编辑每个项目文件的情况下做到这一点我知道这听起来可能是一个坏主意但我们仅使用 Postsharp 进行异常日志记录
Spring Boot REST API/Spring Security：身份验证失败时返回自定义消息

我有一个 Spring Boot 应用程序使用 Jersey 作为 JAX RS 实现这是我的安全配置 Configuration EnableGlobalMethodSecurity prePostEnabled true Enabl
有没有可能使用 PHP 获取 Google 网站管理员工具 (GET) 数据？

我正在尝试从中获取一些数据谷歌网站管理员工具 GWT 我搜索了一些 API 文档和实现但它们仅从 GWT 返回了一些数据我的需求我搜索了一些 API 文档和实现我在 PHP 中为此 GWT API 使用了两个文件我是您引用的代码
Dagger 2 - 缺少构造函数注入示例

我花了几个小时进行搜索但仍然没有找到任何关于 Dagger 2 构造函数注入的明确示例假设我有以下声明如何使用 Dagger 2 注入在某处创建 B 类的实例 Module public class ClassA Provides p
从 master 重新启动 Jenkins Slave

我使用 jenkins 主从配置来捕获产品的性能指标我们观察到 jenkins slave 倾向于积累内存从而影响捕获的性能指标为了确保捕获的指标的一致性我们正在考虑每天在从站上没有运行作业时从主站重新启动 jenkins 从站这
允许匿名访问单个 WCF 服务方法

我有一个具有消息安全性和用户名凭据的 WCF 服务我的大多数方法都是从 PrincipalPermission SecurityAction Demand Role ConstStrings Roles Admin 并且这些方法应该仅由经
Crashlytics 报告 TextView.makeSingleLayout 的多个问题

我收到多个关于同一错误的崩溃报告但我不知道是什么原因导致的抛出的异常是ArrayIndexOutOfBoundsException in android widget TextView makeSingleLayout 我知道这与 An
如何在不调用rs.initiate()的情况下初始化mongodb复制集？

我尝试使用 replSet 1 启动 mongod 如下所示 mongod dbpath x y replSet 1 但我不断收到诸如您需要通过调用 rs initiate 来初始化复制集之类的错误然后我启动 mongo shell
委托人（用户或服务帐户）缺少资源的 IAM 权限“cloudtasks.tasks.create”

当我尝试将任务添加到队列时会抛出上述错误消息这是我的设置和有关此问题的信息项目编号 my project 服务帐户 ID my service account 任务队列名称 my queue 任务队列位置 asia northeast
如何在 Docker Alpine 中设置语言环境？

我可以使用 CentOS 映像设置区域设置 FROM centos ENV LANG en US UTF 8 ENV LC ALL en US UTF 8 但它似乎不适用于 Alpine 图像如何使用 Alpine 图像设置区域设置它对
在 ASP.NET MVC 中显示另一个控制器的视图

是否可以显示另一个控制器的视图比如说我有一个CategoriesController and a Category NotFound aspx看法当在CategoriesController 我可以轻松返回View NotFound 现
在 WooCommerce 中显示每个购物车商品的重量

我正在使用 Woocommerce 并尝试在购物车页面上显示每个产品的产品重量我用过这个 add action woocommerce cart collaterals myprefix cart extra info function
通过重写URL访问Couchdb数据库URL，带有查询参数

我的网站用完了 Couch DB 实例因此我将我的虚拟主机配置为指向 dbname design app rewrite 我希望能够从 Web 浏览器访问索引页面同时仍然通过 Ajax 访问 Couch DB API 因此我在我的文件中
单击 UISegmentedControl 的一段后显示多行文本，但最初不是 - 更新代码

我需要在每个段中设置多行文本UISegmentedControl 我尝试了下面的代码它工作正常但问题是当第一次加载页面时第一次显示分段控件时它不显示多行文本但是当我单击其中一段文本以多行显示如何解决这个问题这是代码 voi
实例方法中的静态变量

假设我有这个程序 class Foo public unsigned int bar static unsigned int counter 0 return counter int main Foo a Foo b 当然这个例子没有任何意
python中access数据库表的读写

我有一个访问数据库里面是我创建的几张桌子我想使用 python 读取其中一个表并列出一列中的所有内容我想将该列表与程序中已创建的另一个列表进行比较如果该数字与列表中的数字匹配则在我制作的访问电子表格的同一行新列中输出是同样如
MySQL 查询 - 每组最近的条目

我正在尝试选择表中每组的最新条目假设我有一个表 blog posts 其中有一列 id 全部唯一自动递增 post cat 可以是值 category1 或 category2 或 category3 以及一个 publish stat
如何提高 ASP.NET MVC 中从 SQL Server 数据库获取数据的速度 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是 ASP NET MVC5 的新手我有一个模型Shipping and my dbo Shippings sql是这样的 CRE
检查函数是否被调用为装饰器

在下面的最小示例中decorate被调用两次第一次使用 decorate 第二个通过正常函数调用decorate bar def decorate func print func name return func decorate def
在 NetworkX 中合并两个加权图

我使用 python 多重处理来创建多个不同的 NetworkX 图然后使用下面的函数来组合这些图然而虽然这个函数对于小图工作得很好但对于较大的图它会使用大量内存并且会挂在我的系统和内存密集型 AWS 系统上仅使用系统中总内存

在 NetworkX 中合并两个加权图

在 NetworkX 中合并两个加权图 的相关文章

随机推荐

热门标签

在 NetworkX 中合并两个加权图的相关文章