概率图论PGM的D-Separation(D分离)

2023-11-06

出处:http://my.oschina.net/dillan/blog/134011


其中找了一些资料发现原文中阻塞(block)中(b)部分有出路,黑体部分修改了一下,那么‘四应用例子’部分答案也跟着修改,如果理解有误希望能给予解释,谢谢!资料参考在最下部分‘六、补充参考资料例子’。

一、引言

在贝叶斯网络的学习过程中,经常会遇到(D-Separation)D-分离这个概念,D-分离是寻找网络节点之间的条件独立性的一种方法或者说一种问题的简化处理的技巧。采用D-分离技术,在用贝叶斯网络进行预测,诊断推理等方面,可以提高计算速度,减少计算复杂性。

D-Separation是一种用来判断变量是否条件独立的图形化方法。相比于非图形化方法,D-Separation更加直观,且计算简单。对于一个DAG(有向无环图)E,D-Separation方法可以快速的判断出两个节点之间是否是条件独立的。

二、三种情况分析

首先可以看看以下三种简单情况下条件独立的情况(对应于PRML中8.2.1的Three example graphs):

Example One:tail-to-tail (节点C连接的是两个箭头的尾部,如图)

可知, P(a,b,c)=P(a|c)*P(b|c)*P(c)    (1)

现在我们求 P(a,b),如果 P(a,b)=P(a)*P(b),则a和b是在c条件下独立分布的。分两种情况进行讨论:

(1)C值不作为观察点。令(1)式对c求积分,消去c值,考虑c是离散的情况,可得

可以看到,与 P(a,b)=P(a)*P(b)不等,所以a和b不是c条件独立的。

(2)C值作为观察点(即以C作为条件)。则可以知道C取某个c状态的概率为 P( c ),c 条件下 a 和 b发生的概率为 

P( a,b|c )。 由下式:

可得a 和 b 是 c 条件下独立的。

Example Two:head-to-tail

可知,p(a,b,c)=p(a)*p(c|a)*p(b|c)   (2)

同样分两种情况进行讨论:

(1)、c值不作为观察点。对(2)式(考虑c是离散的情况)积分可得:

可知,a和b不是c条件独立的。

(2)、c值作为观察点。则图模型表示为:

c 条件下 a 和 b发生的概率为 P( a,b|c )。 由下式:

可知,a 和 b 是 c 条件下独立的。

Example Three:head-to-head

可知 p(a,b,c)=p(a)*p(b)*p(c|a,b)    (3)

同理,分两种情况讨论:

(1)、c值不作为观察点。由于所有p(c|a,b)相加和=1,所以有(3)式消去c,可得 p(a,b)=p(a)*p(b),即a与b是条件独立的。

(2)、c值作为观察点。

所以有:

最后不能因式分解成p(a)*p(b)的形式,所以a与b不是c条件独立的。

三、总结

对于较为复杂的 DAG 图,我们可以给出一个普遍意义上的结论 ,也就是 D-Seperation。 对于 DAG 图 E,如果A,B,C是三个集合(可以是单独的节点或者是节点的集合),为了判断 A 和 B 是否是 C 条件独立的, 我们考虑 E 中所有 A 和 B 之间的 无向路径 。对于其中的一条路径,如果她满足以下两个条件中的任意一条,则称这条路径是 阻塞(block) 的:

(a)路径中存在某个节点 X 是 head-to-tial 或者 tail-to-tail 节点(Example one/two),并且 X 是包含在 C 中的;

(b)路径中存在某个节点 X 是 head-to-head 节点(Example Three),并且 X 或 X 的儿子是不包含在 C 中的; 

如果 A,B 间所有的路径都是阻塞的,那么 A,B 就是关于 C 条件独立的;否则, A,B 不是关于 C 条件独立的。

四、应用例子

根据D-Seperation分隔定理,我们可以很容易的判断是否是条件独立的。我们来看一个例子:

判断图中a与b是否在c条件下独立a与b是否在f条件下独立

判断 a 和 b 是否是 c下条件独立的: a 到 b 只有一条路径 a->e->f->b 。 考虑路径上的点 e 和 f :其中e 是 head-to-head 类型的,且 e 的儿子节点就是 c ,根据(b),e不阻断。而节点f是tail-to-tail类型节点,根据(a),f不在c中,所以也有a,b不是c条件下独立。

判断 a 和 b 是否是 f 下条件独立的:路径 a->e->f->b 上的所有节点。考虑路径上的点e和f:节点 e 是head-to-head 类型的,e 和她的儿子节点 c 都不在 f 中,所以(b),e是阻断路径的节点。节点 f 是tail-to-tail类型节点,且 f 节点就在 f中,所以 f 节点阻断了路径。 结论:a 和 b是 f 下条件独立的。

       D-Seperation 还可以用来证明独立同分布马尔科夫边界等。

五、参考资料

1、http://www.andrew.cmu.edu/user/scheines/tutor/d-sep.html#d-sepapplet2

2、http://blog.sina.com.cn/s/blog_7a24649f0101hjdx.html

3、《pattern recognition and meaching learning》-chapter 8:Graphical Model-8.2 conditional independence

六、补充参考资料例子



1.P( G , L | B ),因为根据规则1,给定B阻塞了G和L之间的惟一的路径。根据给定B,M也阻
塞了这个路径,因为M不是证据集的一个成员。

2.I(G,L)和I(B,L),因为按规则,给定空的证据集合, M阻塞了G和L之间、B和L之间的
(惟一)路径(M不是空的证据集
的一个成员)。

然而,注意, B和L不是条件独立于给定的M的。因为虽然M在B和L的路径上,但这个路径上的两条弧都指向M,且M在证据集合中—因此在这种情况下,M没有阻塞路径。

七、Cousera上的PGM例子

课上的explanation:

d-sep (D, J | L, I) is the only statement that is true. If we observe L, the V-structure at G is activated, so influence can flow from D through I to J. Likewise, if we observe H, then the V-structure at H is activated, allowing influence to flow from D to J through H.

我的理解:
A.d-seq(D,I|L):考虑路径:Diffuculty-Grage-Intelligence,Grade是head-to-head节点类型,其孩子节点Letter是条件集合中,因此不是条件独立,该项不是d分离。
B.d-seq(D,J|L):考虑路径:Diffuculty-Grage-Letter-Job,节点Grade是head-to-tail节点类型,其不在条件集合中,因此不是条件独立,该项不是d分离。
C.d-seq(D,J|L,I):考虑路径1:Diffuculty-Grage-Letter-Job,L是head-to-tail节点类型,且在条件集合中,因此是条件独立。考虑路径2:Difficulty-Grade-Happy-Job,Happy是head-to-head节点类型,但Happy不在条件集合中,因此条件独立。考虑路径3:Difficulty-Grade-Intelligence-SAT-Job,Grade是head-to-heat节点类型,但不在条件集合中,是条件独立。所有路径都是阻塞,因此该项符合d分离。

D.d-seq(D,J|L,H,I):考虑路径:Diffuculty-Grade-Happy-Job,其中第二条路径,Happy是head-to-head节点类型,但Happy在条件集合中,所以该路径中的D、J不是条件独立,所以该项不是d分离。

一个简单的数学证明:

P(D,S)=P(D)*P(S)


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

概率图论PGM的D-Separation(D分离) 的相关文章

  • AIX下使用ASM

    metalink note 282036 1 IBM Software Requirements and PTFs for AIX 5 3 support of Oracle Database 10g Release 2 10 2 0 1
  • Anaconda 的Jupyter Notebook更换默认浏览器

    因为之前装的Anaconda默认使用的是系统自带的Edge浏览器 对的 就是这个玩意 然后自己近期一直用的win11 前几个版本还没什么太大问题 但是在20号左右系统自动更新了一下 对的就是这个 然后Microsoft Edge浏览器直接打
  • LUA中的and与or

    LUA中的and与or 2013 01 04 14 51 14074人阅读 评论 2 收藏 举报 分类 Lua 44 逻辑运算符认为false和nil是假 false 其他为真 0也是true and的优先级比or高 其它语言中的and表示
  • 小程序的数据驱动和Vue的双向绑定有何异同

    引言 在现代应用程序开发中 数据驱动和双向绑定是两个非常重要的概念 它们能够提供更好的用户体验和开发效率 本文将探讨小程序的数据驱动和Vue的双向绑定 并通过代码实例来说明它们的异同 让我们一起来了解吧 小程序的数据驱动 小程序是一种轻量级
  • Java初阶——练习题

    import java util Random import java util Scanner public class java 11 1 public static void main String args int ret numb

随机推荐

  • 模板的特化(具体化)

    模板的特化 具体化 重点注意 1 类模板和函数模板都可以被全特化 2 类模板能偏特化 不能被重载 3 函数模板可以实现重载 不能被偏特化 4 类模板调用优先级 全特化类 gt 偏特化类 gt 主版本模板类 6 函数模板同时存在具体化模板 函
  • ZYNQ中FreeRTOS中使用定时器

    使用普通的Timer中断方式时 Timer中断可以正常运行 但是UDP通信进程无法启动 其中TimerIntrHandler是中断服务程序 打印程序运行时间与从BRAM中读取的数据 void SetupInterruptSystem XSc
  • JetBrains各版本全家桶工具 编程开发全套永久软件!IDE也能免费用

    程序员每次换新电脑装IDE总是少不了的 但是奈何激活码难找 功夫不负有心人终于让我找到了激活方法 而且是可以永久激活的 更赞的是操作简单 无需注册机也无需修改文件和host 而且支持2018 2019 2020全版本的全家桶软件 之前也激活
  • shell 多线程介绍与举例

    在Shell脚本中实现多线程通常可以使用以下几种方式 后台执行 在Shell脚本中 你可以使用 符号将某个命令放在后台执行 这样可以同时执行多个命令 达到多线程的效果 例如 bin bash command1 command2 comman
  • CSerialPort教程4.3.x (4) - CSerialPort在QT中的使用

    CSerialPort教程4 3 x 4 CSerialPort在QT中的使用 环境 QT 5 6 3 前言 CSerialPort项目是一个基于C C 的轻量级开源跨平台串口类库 可以轻松实现跨平台多操作系统的串口读写 同时还支持C Ja
  • FTP:服务器发回了不可路由的地址,使用服务器地址代替 问题解决方案

    状态 连接建立 等待欢迎消息 状态 初始化 TLS 中 状态 TLS 连接已建立 状态 已登录 状态 读取目录列表 状态 服务器发回了不可路由的地址 使用服务器地址代替 打开阿里云控制面板 把放行端口中的39000 40000加入放行规则
  • Java设计模式(9):桥接模式

    9 桥接模式 Bridge 9 1 问题引入 手机类型 现在对不同类型不同品牌的手机实现操作编程 如下手机外观类型和对应品牌 则需要编写的代码类图可能如下 带来的问题如下 如果我们需要添加一个手机 则需要在各个类型下添加手机 如果我们需要添
  • 股票数据API接口进行实际对接过程当中要注意哪些方面?

    投资者使用股票量化接口API接口方面使用能够节约不少的成本 不过在进行实际对接的过程当中 一定要从零开始做好研发建设 只要进入系统之后就能够完全体验到接口带来的更多优势 如果选择一些不靠谱的API接口 可能会浪费金钱 甚至会给大多数用户造成
  • 汇编基础(1)--ARM32

    简介 ARM32 也称为ARM Architecture v7 是一种32位的指令集架构 ISA 由ARM公司开发并广泛应用于嵌入式系统和移动设备 ARM32是ARM体系结构中较早的版本 被许多处理器核使用 包括Cortex A Corte
  • 【PTA】数组排序

    对n个整数进行降序排列 然后输出 import java util public class Main public static void main String args Scanner scanner new Scanner Syst
  • python 第三方库的安装与出错解决方案

    今天介绍五种第三方库的安装方法与错误解决方式 1 wordcloud win 加r输入cmd回车在命令行输入pip install wordcloud 如果下载成功则会出现successful 如果出现错误的话则会出现红色字体和erro提示
  • Android 字符串的替换,截取,拆分,拼接

    1 去除字符串中的 逗号替换成 符号 public static String ReplaceString List
  • uniapp中版本更新下载.apk文件并安装

    首先调用版本更新的接口传入当前版本好 判断是否需要版本更新 版本需要更新使用plus downloader createDownload进行下载 下载完成后使用plus runtime install进行安装 updateVersion d
  • 02_uboot的工作方式_常用命令_常用环境变量

    一 uboot的工作方式 1 uboot的本质 uboot的本质是一个裸机程序 由若干的 c文件和 h文件组成 配置编译后生成uboot bin 把这个镜像文件烧录至启动介质中给soc启动 一般的uboot大小在180k 400k之间 我你
  • RegNeRF,FreeNeRF: 神经辐射场的自由频率正则化,几何正则化,外观正则化,遮挡正则化

    目录 概要 一 论文 RegNeRF Regularizing Neural Radiance Fields for View Synthesis from Sparse Inputs 1 几何正则化 2 外观正则化 二 论文 FreeNe
  • Python编程题每日一练day2(附答案)

    Python编程题每日一练day2 Python编程题每日一练day1 附答案 一 被8整除的数字 二 九九乘法表 三 判断素数 四 重复出现的字符串 五 密码游戏 提高编程能力的最有效办法就是 敲代码 Python编程题每日一练day1
  • 彻底搞懂String:字符串常量池

    作为最基础的引用数据类型 Java 设计者为 String 提供了字符串常量池以提高其性能 那么字符串常量池的具体原理是什么 我们带着以下三个问题 去理解字符串常量池 1 字符串常量池的设计意图是什么 2 字符串常量池在哪里 3 如何操作字
  • React styled-components

    React styled components 参考 styled components 让 React 如虎添翼 React styled components 让前端开发如虎添翼 哔哩哔哩 bilibili styled compone
  • matlab数字仿真实验,matlab数值仿真

    matlab数值仿真10 1知识要点与背景 单自由度阻尼系统 2 观察程序 zxy10 1 m 图10 1 a clear clf global c w x0 1 1 x0 2 0 w 10 n 3 tspan linspace 0 4 1
  • 概率图论PGM的D-Separation(D分离)

    出处 http my oschina net dillan blog 134011 本文大部分来自 http www zhujun me d separation separation d html 其中找了一些资料发现原文中阻塞 bloc