使用Python实现卡恩拓扑排序算法

2023-12-08

Kahn 在 62 中提出了一个算法拓扑排序任何 DAG（有向无环图），从维基百科复制的伪代码：

L ← Empty list that will contain the sorted elements 
S ← Set of all nodes with no incoming edges 
while S is non-empty do
    remove a node n from S
    add n to tail of L
    for each node m with an edge e from n to m do
        remove edge e from the graph  # This is a DESTRUCTIVE step!
        if m has no other incoming edges then
            insert m into S if graph has edges then
    return error (graph has at least one cycle) else 
    return L (a topologically sorted order)

我需要使用 IPython3 来实现它，并使用以下 DAG 实现：

class Node(object):
    def __init__(self, name, parents):
        assert isinstance(name, str)
        assert all(isinstance(_, RandomVariable) for _ in parents)
        self.name, self.parents = name, parents

where name是节点的标签，parents存储其所有父节点。那么DAG类的实现如下：

class DAG(object):
    def __init__(self, *nodes):
        assert all(isinstance(_, Node) for _ in nodes)
        self.nodes = nodes

（DAG 实现是固定的，无需改进。）然后我需要将卡恩算法实现为函数top_order它接受一个 DAG 实例并返回一个类似于(node_1, node_2, ..., node_n)。主要的问题是，该算法具有破坏性，因为它的步骤之一是remove edge e from the graph（第 5 行）这将删除的一名成员m.parents。然而，我必须保持 DAG 实例完好无损.

到目前为止我能想到的一种方法是创建一个deep获取DAG实例的副本（即使是浅副本也无法完成这项工作，因为算法仍然通过引用破坏原始实例），并对这个副本执行破坏性算法，然后得到这个节点名称的正确顺序复制（假设节点之间不存在命名冲突），然后使用此名称顺序来推断原始实例的节点的正确顺序，大致如下：

def top_order(network):
    '''takes in a DAG, prints and returns a topological ordering.'''
    assert type(network) == DAG
    temp = copy.deepcopy(network) # to leave the original instance intact

    ordering_name = []
    roots = [node for node in temp.nodes if not node.parents]
    while roots:
        n_node = roots[0]
        del roots[0]
        ordering_name.append(n_node.name)
        for m_node in temp.nodes:
            if n_node in m_node.parents:
                temp_list = list(m_node.parents)
                temp_list.remove(n_node)
                m_node.parents = tuple(temp_list)
                if not m_node.parents:
                    roots.append(m_node)

    print(ordering_name) # print ordering by name

    # gets ordering of nodes of the original instance
    ordering = []
    for name in ordering_name:
        for node in network.nodes:
            if node.name == name:
                ordering.append(node)

    return tuple(ordering)

两个问题：第一，什么时候network巨大时深拷贝会消耗资源；其次，我想要改进我的嵌套for循环获取原始实例的顺序。（对于第二个我认为类似sorted方法等突然出现在我的脑海中。）

有什么建议吗？

我将建议一种不那么字面意义的算法实现：你根本不需要操作 DAG，你只需要操作信息about有向无环图。该算法需要的唯一“有趣”的东西是从节点到其子节点的映射（与 DAG 实际存储的相反），以及每个节点的父节点数量的计数。

这些很容易计算，并且可以使用字典将此信息与节点名称相关联（假设所有名称都是不同的 - 如果不是，您可以使用更多代码来发明唯一的名称）。

那么这应该有效：

def topsort(dag):
    name2node = {node.name: node for node in dag.nodes}
    # map name to number of predecessors (parents)
    name2npreds = {}
    # map name to list of successors (children)
    name2succs = {name: [] for name in name2node}

    for node in dag.nodes:
        thisname = node.name
        name2npreds[thisname] = len(node.parents)
        for p in node.parents:
            name2succs[p.name].append(thisname)

    result = [n for n, npreds in name2npreds.items() if npreds == 0]
    for p in result:
        for c in name2succs[p]:
            npreds = name2npreds[c]
            assert npreds
            npreds -= 1
            name2npreds[c] = npreds
            if npreds == 0:
                result.append(c)

    if len(result) < len(name2node):
        raise ValueError("no topsort - cycle")
    return tuple(name2node[p] for p in result)

这里有一个微妙的点：外循环附加到result while它正在迭代result。这是故意的。效果是每个元素result无论元素是否在初始元素中，外循环都会只处理一次result或稍后添加。

请注意，虽然输入DAG and Nodes 被遍历，其中没有任何内容被改变。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用Python实现卡恩拓扑排序算法的相关文章

除下一行的值并在数据框中创建列

我有一个像这样的csv id value 1 100 1 150 1 200 1 250 2 300 2 350 2 400 2 450 我想根据每个唯一 ID 的值生成一列例如 id 1 的前 2 行值为 100 150 我正在尝试创建
编程式 Google 登录/注销用户 1，然后登录用户 2 (Python)

我正在开展一个 DIY 项目为我的家庭中的多个成员检索 Google 位置历史记录根据 StackOverflow 成员的指示 t m 亚当 https stackoverflow com users 7811673 t m adam
Python 3 中的相对导入

我想从同一目录中的另一个文件导入函数通常以下其中一项有效 from mymodule import myfunction from mymodule import myfunction 但另一个给了我以下错误之一 ImportError
为什么 enumerate、zip、range 类型不属于 types.GeneratorType？

Python 3 引入了类似生成器的对象在调用时返回range and zip 返回的对象就像一个生成器可以迭代一次但不能很好地打印就像enumerate 返回参数然而我很困惑地发现它们是不同的对象类型并且不属于types G
Selenium Python Firefox webdriver：无法修改配置文件

我想在 Webdriver Firefox 实例上使用新选项卡而不是窗口选项 1 我创建了一个启用此选项的配置文件但是当我使用该配置文件时很多选项都可以但不是这个 2 加载配置文件后我尝试更改代码中的选项但它不起作用我的代码
在 python3 中优雅地退出多进程[重复]

这个问题在这里已经有答案了我想通过 Ctrl C SIGINT 或用户输入优雅地退出程序如果可能的话终端应该提示类似的内容按 Enter 键终止 Python 3 6 执行的代码 def worker process i 0 whi
在Python中将字典转换为以键作为对象名称的对象

我有一本这样的字典 d item1 Hi 150 495 item2 Hola 590 40 我想将其转换为对象如果可能的话递归地我有一堂课 class Item def init self thetuple self greeting
导入错误：无法导入名称线程

这是我第一次学习Python 我继续尝试线程这篇博文 http www saltycrane com blog 2008 09 simplistic python thread example 问题是它似乎已经过时了 import time
Windows7上python3.5无法安装BeautifulSoup4

我已经从下载了 beautifulsoup4 4 5 3 tar gzhttps www crummy com software BeautifulSoup bs4 download 4 5 https www crummy com sof
为什么在“ except”块之后使用命名异常会得到“ NameError”（或“ UnboundLocalError”）？

此示例代码在 2 x 中运行 exc None try raise Exception except Exception as exc pass print exc 但在 3 x 中我收到一个错误 NameError name exc is
现在与出生日期之间的年、月、日、分钟差异

import datetime birthday datetime datetime 1996 8 15 differnce datetime datetime now birthday This returns a timedelta o
C#：为派生类继承单独的静态成员

我的问题简述 class A Other stuff in my class protected static staticMember class B A Other stuff in my class Will have A stati
我应该使用课程吗？（Python）

我正在尝试编写一个包含一些数学函数的小型 Python 模块例如它可能包含如下函数 def quad x a b c return a x 2 b x c 您可能会注意到它包含几个参数即a b c 除了变量x 现在如果我将其放入文件
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
TypeError：在 Python 3.8.1 上运行 Pytest 脚本时，参数中缺少必需字段“posonlyargs”

我在 Python 3 8 1 上创建了一个简单的 Selenium Pytest 自动化脚本运行脚本后我看到以下错误 Traceback most recent call last Error messages TypeError r
使用什么算法来确定使系统达到“零”状态所需的最小操作数？

这是一种更通用的问题不是特定于语言的有关要使用的想法和算法的更多信息系统如下它登记朋友群体之间的小额贷款 Alice and Bill要去吃午饭比尔的卡坏了所以爱丽丝支付了他的餐费 10 美元第二天Bill and Charl
不能从模板 C++ 类继承[重复]

这个问题在这里已经有答案了我不知道这里出了什么问题也许有人可以帮助我我想继承我的新班级MyDictionary来自模板抽象类dictionary 我有这样的代码字典 h ifndef UNTITLED CPP DICTIONARY
如何生成类似github的影响图？

是否有一些程序或者我错过的一些神奇的 git 插件可以从 git 存储库获取影响图或类似的东西而无需通过 github 就数据收集而言我可以生成图表我不确定从哪里开始编写自己的代码我假设有一些标志我可以传递给 git log 来
CodeIgniter：My_Lang 中的 get_instance

我发现这个有用的国际化代码 http pastebin com SyKmPYTX http pastebin com SyKmPYTX 一切正常除了我无法在此类中使用 CI 函数我想从 DB 设置 languages 和 special
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

Oracle APEX - 使用按钮将查询导出到 CSV

我在 apex 页面上有一个按钮允许用户将数据基于最终用户未看到的查询导出到 CSV 文件中如何将此按钮链接到我的查询以便我们可以将结果导出到 CSV 文件中 Thanks 我通过在页面上定义一个区域来执行此操作条件从不但您
如何使用 Spring Boot 上传多个文件并使用 cURL 进行测试

我已经实现了一个控制器来上传多个文件 public class Image implements Serializable private MultipartFile file private Ingeger imageNumber Req
在 JavaScript 中解析 URL

我需要在 JavaScript 中解析 url 这是我的代码 var myRe var myArray myRe exec page 3 Name Alex for var i 1 i
动态分配内存

让我们考虑以下两个代码 First for int i 0 i lt 10000000 i char tab new char 500 delete tab Second for int i 0 i lt 10000000 i char t
找不到名称/键为 PhoneProgressBarBackgroundBrush 的资源

过去两天我一直在尝试调试这个问题我已经尝试了 SO 和 Microsoft connect 上提供的所有解决方案但似乎找不到任何解决方案我下载了 Windows Phone 8 sdk 安装并创建了一个新项目但是当我尝试编辑 App
仅使用 EC2 实例时出现 EADDRNOTAVAIL

我的节点应用程序正在侦听端口 8080 当我添加 app listen port 50 30 217 289 我可以从浏览器访问该应用程序但是当我将 IP 地址替换为 EC2 实例的弹性 IP 地址时出现错误 EADDR不可用我该如
SPARK + 独立集群：无法从另一台机器启动工作程序

我一直在设置 Spark 独立集群设置按照此链接我有2台机器第一个 ubuntu0 既充当master又充当worker 第二个 ubuntu1 只是一个worker 两台机器都已正确配置无密码 ssh 并通过在两侧手动执行 SSH 进
使用 Twilio 通过 POST 发送消息，但不接受 JSON 或 XML 形式的正文，只有 To、From 和 Body 的普通参数有效

我使用的平台强制我发送带有 JSON 格式或 XML 格式正文的 POST 请求因此为了进行测试我使用 SOAPUI 以便我可以准确指定测试所需的正文我正在发布到 URLhttps api twilio com 2010 04 01
在 iOS 中保持应用程序空闲一段时间后，SRWebsocket 连接会自动关闭

我正在使用 SRWebSocket 在 iOS 中打开 websocket 连接但是如果我有时让应用程序保持空闲状态连接就会自动关闭之后当我尝试发送任何数据时 Websocket 连接失败在我手动断开连接之前是否有办法保持 w
一次获取 LinearLayout 内的所有子视图

我有一个LinearLayout 其中包含多个子项TextViews 如何使用循环获取 LinearLayout 的子视图 Use getChildCount and getChildAt int index Example LinearL
Mono.Linker.MarkException：错误处理方法：'System.Void Plugin.LocalNotification.Platform.Droid.NotificationServiceImpl

将 Xamarin Forms 版本更新到最新稳定版本 4 6 0 800 后在发布模式下进行构建时出现错误 Library Frameworks Mono framework External xbuild Xamarin Androi
Observable 中的更改未反映在 View 中

我基本上是跟着本指南实现 Observable 数据服务在商店类中 ItemsStore 我有我的BehaviorSubject其中包含项目列表 items BehaviorSubject
java.lang.NumberFormatException：无效的 int：“”：错误

我正在做一些计算但无法将字符串解析为 int 甚至 float 我搜索了解决方案并在某个地方读到它必须有一个空字符串但我使用检查了我的 editText log v Valuee e1 getText toString 其打印值证明
C++ 二项式系数太慢

我尝试通过帕斯卡三角形进行递归来计算二项式系数它对于小数量来说效果很好但是 20 up 要么非常慢要么根本不起作用我尝试查找一些优化技术例如 chaching 但它们似乎并没有真正很好地集成在 C 中如果对您有帮助的话这是代码
如何将所有子文件夹输出到 HTA 中的下拉列表？

我有如下代码我想将 K work 中的所有子文件夹输出到此 HTA 的下拉列表中因为 k work 中的所有子文件夹一直在变化所以每次我单击下拉列表时它都需要有最新的内容根据我的代码可以做到这一点吗另外当我选择新客户时我需要
使用 Python 和 Pandas 抓取数据

我正在尝试使用以下代码获取结果表 import pandas as pd url https www betfair co uk sport football df pd read html url header None df 0 如果您
更改最大上传文件大小

我有一个网站托管在我无法访问的电脑上我有一个上传表单允许人们上传最大 30MB 的 mp3 文件我的服务器端脚本是用 PHP 完成的每次我尝试上传文件时都会收到一条错误消息声称该文件超出了允许的最大大小因此我需要增加大小我在
选择data.table的列并返回向量

是否可以选择 data table 的一列并返回向量在基数 R 中参数drop TRUE就可以了例如 library data table dat lt as data table iris dat Species returns d
argv[1] 仅包含 Visual C++ 2010 中第一个命令行参数的第一个字母 [重复]

这个问题在这里已经有答案了可能的重复 C 中 tmain 和 main 有什么区别我有一个控制台应用程序它采用一个命令行参数 int tmain int argc char argv printf Path s n argv 1 当我
使用Python实现卡恩拓扑排序算法

Kahn 在 62 中提出了一个算法拓扑排序任何 DAG 有向无环图从维基百科复制的伪代码 L Empty list that will contain the sorted elements S Set of all nodes wit

使用Python实现卡恩拓扑排序算法

使用Python实现卡恩拓扑排序算法 的相关文章

随机推荐

热门标签

使用Python实现卡恩拓扑排序算法的相关文章