14. Bayesian Networks With Examples in R的学习笔记(贝叶斯网络 bic打分相关)

2023-11-20

bnlearn官网推荐书目《Bayesian Networks With Examples in R》,下载了英文版pdf学习了一下,书还是比较浅显易懂的,没有读多少,暂时把自己看的部分整理+翻译到这里留存。欢迎大家交流

〇、 pdf下载地址

http://www.allitebooks.org/
Jesus!这么好的网站我怎么没有早点遇到!里面有各种各样的Turing或者O’Reilly出版社的pdf,其中就包含这一本Bayesian Networks With Examples in R。

阅读下文注意:

  • 引用框中所有文字均是自翻的原文的翻译
  • 引用框外的文字是博主自己的注释/理解/ 废话
  • 【】里面的英文原文
  • 所有内容均会贴上书目页码
  • 部分会贴上英文原文

一、例子介绍(P1)

下文举例子用的例子是“火车使用调查”这个例子,其目的是调查不同交通工具的使用模式,重点是汽车和火车。这些调查被用来评估不同社会群体的客户满意度,评估公共政策或城市规划。在我们当前的例子中,我们将Survey涉及的每个个体的以下六个离散变量展示出来:A代表年龄Age,S代表性别Sex,E代表教育水平高低Education,O代表职业Occupation,R代表居住的城市大小Residence,T代表个人偏爱的交通工具Travel。初始网络形状如下图:

在这里插入图片描述

二、概率表示(P7)

为了完成BN建模调查,我们现在将计算这些变量的联合概率分布。然而,直接使用全局分布是困难的;即使是像我们这样的小问题,其参数的数量也非常多。幸运的是,我们可以使用DAG中编码的信息将全局分布分解为一组更小的局部分布,每个分布对应一个变量。回想一下,弧表示直接依赖关系;如果有一条从一个变量到另一个变量的弧,则后者取决于前者。换句话说,没有弧连接的变量是条件独立的。所以可以分解如下:
在这里插入图片描述
可见,每个变量只取决于它的父变量;它的分布是单变量的,并且有(相对)较少的参数。

注意下面这段话博主自己理解不是很准确,也是第一次见到(因为太菜了),贴出原文。

【Even the set of all the local distributions has, overall, fewer parameters than the global distribution. The latter represents a more general model than the former, because it does not make any assumption on the dependencies between the variables. In other words, the factorisation in Equation (1.1) defines a nested model or a submodel of the global distribution.】
总体而言,即使是所有局部分布的参数也比全局分布的少。后一种模型比前一种模型更一般,因为它没有对变量之间的依赖关系做出任何假设。换句话说,方程(1.1)中的因式分解定义了全局分布的一种嵌套模型或者说子模型。

三、Network Score (P17底部)

连续的打分与离散的有许多相似之处。

博主个人研究需要,重点在连续部分,但是由于连续和离散本是同根生,所以仍然要从离散看起。

与条件独立测试不同,网络测试的分数集中在DAG整体上,反映了DAG对数据的拟合程度。【They are goodness-of-fit statistics measuring how well the DAG mirrors the dependence structure of the data 】同样,有几个分数是常用的。其中一个是贝叶斯信息准则(BIC),在我们的Survey网络中采用了这种形式

Survey是文章中的一个例子,是一个贝叶斯网络结构。R类型为bn。可见 一、例子介绍(P1)

这里是引用
其中n为样本量;d为整个网络的参数个数(也就是21);dA、dS、dE、dO、dR、dT是与每个节点相关联的参数个数每个局部分布均为正态分布

在R中可以用如下方式调用 在这里插入图片描述
或许你注意到了第二句代码中 iss = 10 这个参数,ISS是imaginary sample size的缩写,它的背景是:(我们认为)分配给先验分布的权重与一个假想样本的大小(也就是ISS)有关,对于小 的iss值或大的观测样本,bde和bic分数相似 。

ISS这个参数我也没用过,也没研究过,希望有大佬可以甩链接给我开开眼。QAQ。这里再搬一下前面的关于ISS的解释(见P12)。可能有些绕口。

后验分布的估计值是从条件概率表的均匀先验计算得到的。ISS值就是在控制先验分布和数据的权重,也就是先验分布的假想样本的大小。
ISS除以条件概率表中的单元格数(因为先验是均匀的的 ),然后用经验频率加权平均值来计算后验估计。
ISS的值通常被选得很小,通常在1到15之间,使先验分布很容易被数据支配。 而增大ISS会让后验分布变得平缓

四、 添加一条边对网络分值的影响(P19)

这一部分提到的函数arc.strength,对观察网络变化很有帮助,再夸一次bnlearn。

毫无疑问,从已经学习好的网络中移除任何一条弧都会让bic分数下降。我们可以用arc.strength这个函数来证明:当该弧被移除后,对网络分数造成的改变定义为弧的“strength”。
在这里插入图片描述
很显然,上面的网络和下面那个网络相比,上面的那个网络才是好的,因为它的acr.strength都是负数,也就是说去掉这个边会使网络整体的bic打分降低

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

14. Bayesian Networks With Examples in R的学习笔记(贝叶斯网络 bic打分相关) 的相关文章

  • Win2012服务器 远程桌面帐户允许多用户同时登录的配置方法(2个用户)

    打开任务栏左下角的 服务器管理器 在左侧列表中选中 本地服务器 然后将右侧 远程桌面 功能的选项修改为 启用 注意取消下面复选框的选中状态 修改本地组策略 允许远程桌面帐户的多用户访问 同时按住 Win键 R 组合键调出运行窗口 输入 gp
  • MySQL cmd窗口输入密码后闪退

    最近重新使用回 MySQL 到官网下载客户端版 MySQL Installer 进行安装时 已经设置过 root 密码为 123456 第一次用 cmd 登录时成功 然后再安装 MySQL Workbench 进行连接 却报了错误 auth
  • 基本的Java的MVC入门案例

    概念 MVC Model View Controller 模型 视图 控制器 他是一种专门设计web程序的模式 高内聚 低耦合 高内聚 专人干专事 低耦合 让类与类之间的关系不能太紧密 模型 Model 是应用程序中与处理应用程序数据逻辑的

随机推荐

  • React抽离组件到独立的JS文件中

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 React学习记录 一 抽离组件到独立的JS文件中 1 先创建一个Hello js 2 再创建一个index js文件 React学习记录 一 抽离组件到独立的JS
  • PHP is_array()函数详解,PHP判断是否为数组

    作者主页 士别三日wyx 作者简介 CSDN top100 阿里云博客专家 华为云享专家 网络安全领域优质创作者 推荐专栏 对网络安全感兴趣的小伙伴可以关注专栏 网络安全入门到精通 is array 一 基本使用 二 空数组 三 同时判断多
  • 字节对齐规则和位域

    字节对齐规则 结构体的起始存储位置必须是能够被该结构体中最大的数据类型所整除 每个数据成员存储的起始位置是自身大小的整数倍 比如int在32位机为4字节 则int型成员要从4的整数倍地址开始存储 结构体总大小 也就是sizeof的结果 必须
  • matlab 因果分析,matlab非参数的格兰杰因果分析

    代码1 deseason m function rp vp deseason data textdata days flipud textdata 1 days days 1 end 1 volume flipud data 5 price
  • Vue如何将数据显示在页面中

    如何将data的数据显示在页面中 1 文本插值 div msg div 渲染结果 div hello world div 2 原始HTML插值 v html v text 区别 v text不会对标签进行转义而v html会对标签进行一次转
  • QT笔记——初识QHostInfo、QHostAddress、QNetworkInterface

    网络模块需要在 pro文件中添加 QT network QHostInfo 利用操作系统提供的查询机制来查询与特定主机名相关联的主机的 IP 地址 头文件 include
  • Js中的defer属性和async属性

    Js中的defer属性和async属性 一 defer和async 1 defer 指外部js文件和当前html页面同时加载 异步加载 但只在当前页面解析完成之后执行js代码 async 指外部js文件和当前html页面同时加载 异步加载
  • Redhat Add and Remove Software[No Groups Available in any repository ]

    在 etc yum repos d中把rhel debuginfo repo 修改一下 enabled 1 修改为 enabled 1
  • Java 实现令牌桶限流算法 原生极简实现 包括单机和多线程版本

    文章目录 令牌桶算法简介 令牌桶算法限流范围 单机版实现 多线程版实现 令牌桶算法简介 令牌桶是指一个限流容器 容器有最大容量 每秒或每100ms产生一个令牌 具体取决于机器每秒处理的请求数 当容量中令牌数量达到最大容量时 令牌数量也不会改
  • Python中访问类中的私有变量的两种方法

    我们知道 类中的私有变量是不能直接在类外访问或修改的 因此我们可以设置一个get函数和一个set函数来间接访问和修改私有属性 那么每次访问和修改的都需要调用函数 有没有更简单的方法呢 下面介绍两种方法 1 property 属性函数 比如P
  • 如何保证数据产出质量简述

    如何保证数据产出质量简述 数据质量的评估 数据质量的保障 数据产出流程 机制 revire机制 数据质量保障中的工具 规则 SQLSCAN DQC 基线 数据质量的评估 数据质量可以从一下几个角度进行评估 完整性 完整性是指数据的记录和信息
  • ECG信号三大主要噪声-基线漂移,工频干扰,肌电干扰

    1 基线漂移 基线漂移属于 低频干扰 呼吸的节奏 四肢动作以及前端处理电路设计 都有可能造成基线漂移 致使原始ECG信号漂移之后的 幅度达到R波最大幅值的0 1 0 2倍 ECG信号的一般采用是 粘贴式或吸球式 电极来采集信号 那么存在于体
  • 请关闭该文件夹或文件,然后重试 怎么处理?

    一 打开任务管理器 性能 gt 打开资源监视器 选择CPU gt 搜索句柄中填入文件夹名称 右击结束进程 就能进行操作了
  • 【Linux入门教程】2 文件权限和访问模式、环境变量、管道和过滤器

    Linux文件权限和访问模式 为了更加安全的存储文件 Linux为不同的文件赋予了不同的权限 每个文件都拥有下面三种权限 所有者权限 文件所有者能够进行的操作 组权限 文件所属用户组能够进行的操作 外部权限 其他权限 其他用户可以进行的操作
  • QT编程之信号和槽机制知识

    qt知识总结 一 常见的父窗口有3类 1 QWidget 它是所有对象的基类 继承自QOject和OPaintDevice 2 QMainWindow 它提供了一个主要的应用窗口 可以用来构建APP的应用界面 3 QDialog 对话框 其
  • TensorFlow.js预测鸢尾花种类

    源码连接 TensorFlow js实现鸢尾花种类预测 机器学习文档类资源 CSDN下载 一 加载IRIS数据集 创建index html入口文件 跳转到script主文件 在script js文件夹中利用预先准备好的脚本生成鸢尾花数据集
  • 无公网IP通过旁路由openwrt的Zerotier实现和在家一样访问家里每个设备

    现在的IP地址精贵 很多人拉的线路都没有公网IP了 早期时候有公网IP可以干很多事情 例如架个Web FTP 游戏等各种服务 再通过动态域名 在公司或者朋友可以直接访问 只要映射端口就可以了 如果没有公网IP 其实还有其他办法 例如frp反
  • BGP双平面实验

    实验要求 1 合理IP地址 2 AS 1 2 3 内部使用OSPF 协议 AS 1 AS 2内部建立全互联的IBGP邻居 AS之间建立全部的EBGP邻居 3 PC 1 3 5 属于电信的路由 通信时必须使用电信AS 1 PC 2 4 6 属
  • Linux安装Oracle Database 19c RAC

    版权声明 本文为博主原创文章 遵循 CC 4 0 BY SA 版权协议 转载请附上原文出处链接和本声明 本文链接 https blog csdn net networken article details 120788623 Linux安装
  • 14. Bayesian Networks With Examples in R的学习笔记(贝叶斯网络 bic打分相关)

    bnlearn官网推荐书目 Bayesian Networks With Examples in R 下载了英文版pdf学习了一下 书还是比较浅显易懂的 没有读多少 暂时把自己看的部分整理 翻译到这里留存 欢迎大家交流 pdf下载地址 ht