因果推断(三)——结构因果模型、干预、辛普森悖论

2023-11-04

主要内容

  • 结构因果模型

  • 干预

  • 辛普森悖论

  • 调整公式

结构因果模型(Structural Causal Model, SCM

定义:结构因果模型被定义为一个有序三元组<U,V,f>,U为外生变量,即有模型外部因素决定,外生变量不能是其他变量的后代;V为内生变量,即由模型内部因素决定,内生变量至少是一个外生变量的后代;f为一组方程,通过f可以用外生变量推导出内生变量的值

SCM包含图结构和变量,简单的例子如下:

因果推断(二)中的诺贝尔奖和巧克力的事件为例,B为外生变量,A和C为内生变量,节点之间的边就是f函数

 

干预

 因果关系之梯可以分为三层:关联、干预和反事实

    例1:以巧克力和诺贝尔奖为例,当我们想探究吃巧克力是否会影响诺贝尔奖得主数量时,我们需要进行干预,给之前没吃巧克力的国家的人吃巧克力,给之前吃了巧克力的停止食用巧克力,以此观察结果,分析巧克力是否会影响诺贝尔奖数量。

    在因果推断(二)中,我们介绍了因果关系中的条件独立,这里需要注意的是条件独立和干预的区别。探索条件独立时,我们以某一个变量为条件,然后从观测数据中进行观察。例如以上图的B为条件,A和C独立,我们是选取经济教育水平高的为一组,经济教育水平低的为一组去观察。而干预,是直接赋值,正如上述例1。

    当我们对一个变量进行干预时,这个变量的值就确定了,因此,他不再受父节点的约束,即我们可以从因果图中去掉指向该节点的边,以巧克力和诺贝尔奖事件为例,结合例1,得到新的因果图如下图所示:

 

我们用符号do来表示干预,以区分普通的条件概率。还是以上面的事件为例。

图片

对应的是图1,我们探索的是,在所有样本中,当A=a时,C=c的概率,即取出A=a的样本然后探索他的条件概率。但是如果我们做了干预,将是

图片

,他将对应图2,因果图会发生变化,表示将A都固定为a后,C=c的概率,原始的分布发生了变化。

辛普森悖论

小夏开了有一家tb店,他们请了一位明星为他们宣传,并且统计了不同性别以及总体的购买率进行比较,来分析这次请的明星是否对增加购买量有作用。

明星不宣传 宣传
男性

20/50=0.4

38/100=0.38

女性

30/100=0.3

13/50=0.26

总体

50/150=0.33

51/150=0.34

     从上面表格中,我们可以发现,无论从男性角度还是女性角度,该店通过明星宣传貌似没有达到更好的购买率,但是从总体上看明星宣传还是起到了一定作用的。这就是辛普森悖论:分组比较频率与总体比较频率出现相反结果。不过这个从数学上比较好解释:a/b>c/d, e/f>g/h不能推出(a+e)/(b+f)>(c+g)/(d+h)。这个例子中出现这个悖论的主要原因在于虽然小夏请了明星给他们代言,并且在平台上放了他的照片,但是平台在推送这个代言时,是智能推送的从而导致不同性别的人群被宣传的量存在差异。如下图所示,性别会干扰平台推送这个代言宣传。同时结合因果推断(二),我们可以发现B(性别)是一个混杂因子。

为了探究宣传是否有用,我们假设给所有人都被宣传了do(A=1)得到P(C=1|do(A=1)),然后假设所有人都没有被宣传,P(C=1|do(A=0)),然后进行比较P(C=1|do(A=1))-P(C=1|do(A=0))

由于我们干预了宣传,即所有人都能被宣传到,也就可以排除性别对其的影响,因果图修改如下。

 

调整公式 

P_m表示干预后的概率

图片

,经过干预B的边缘概率以及C的条件概率不会发生变化,并且A和B独立,可以推出调整公式。

这个公式称为调整公式,通过这个调整公式,我们可以用观测数据来计算干预,因为等式右侧的概率都是观测数据中的概率

代言的例子:

由此可得,代言比不代言好。调整公式将在后续的后门调整,前门调整等方法中得到更多应用。 

 更多内容可以关注我的公众号“秋枫学习笔记”

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

因果推断(三)——结构因果模型、干预、辛普森悖论 的相关文章

  • 架构修炼-10:高并发设计

    一 如何衡量高并发的系统性能 1 吞吐量Throughput 2 响应延迟Response Delay 二 性能优化目标 1 缩短响应时间 2 提高系统并发数 提升吞吐量 3 系统处理合理状态 机器利用率 随着系统压力增加 X坐标 在线业务
  • unity 3d水的资源包_使用Unity新一代输入系统实现可配置摄像机

    我们已经介绍过Unity新一代的输入系统 本文 我们将使用Unity 2019 2开发可以移动 缩放和旋转的可配置摄像机 这种设计方法适用于不需要额外附带一个第一或第三人称摄像机 而是可以让游戏视角在场景自由移动的游戏 摄像机的配置功能包括
  • Mysql存储过程和函数区别介绍

    存储存储过程 是一段代码 过程 存储在数据库中的SQL组成 一个存储过程通常用于完成一段业务逻辑 例如报名 交班费 订单入库等 而一个函数通常专注与某个功能 视为其他程序服务的 需要在其他语句中调用函数才可以 而存储过程不能被其他调用 是自

随机推荐

  • C语言每日一练 —— 第21天:算法的应用

    文章目录 前言 一 算法简介 1 推荐算法 2 最短路算法 3 最值算法 4 排序算法 5 压缩算法 6 加密算法 二 为什么要学算法 1 面试时 2 工作中 三 算法能给我们带来什么能力的提升 1 抽象问题的能力 2 解决问题的能力 3
  • AI绘图实战(四):制作食品安全PPT所用的相关图片png、图标icon

    S 你安装stable diffusion就是为了看小姐姐么 I 当然不是 当然是为了公司的发展谋出路 预先学习 安装及其问题解决参考 Windows安装Stable Diffusion WebUI及问题解决记录 运行使用时问题 Windo
  • 【华为OD机试】玩牌高手【2023 B卷

    华为OD机试 真题 点这里 华为OD机试 真题考点分类 点这里 题目描述 给定一个长度为n的整型数组 表示一个选手在n轮内可选择的牌面分数 选手基于规则选牌 请计算所有轮结束后其可以获得的最高总分数 选择规则如下 1 在每轮里选手可以选择获
  • 读写配置文件中的数据

    主要的读取函数 DWORD dwCharacters GetPrivateProfileString strFieldName 节名 strKeyName 键名 strDefault 如果键名不存在 搜索默认键 strTemp GetBuf
  • 微信支付教程

    使用前说明 你必须拥有微信服务号并认证 微信认证每年300元 比较坑 已经开通微信支付商户 网站域名必须备案 PHP5 4或以上的版本并且服务器已安装PHP curl组件 第一步 下载示例代码 https pay weixin qq com
  • 时间序列预测--ARIMA、LSTM

    时间序列预测 ARIMA LSTM ARIMA ARIMA模型全称为差分自回归移动平均模型 Auto regressive Integrated Moving Average Model 简记ARIMA ARIMA p d q 称为差分自回
  • 大话自由职业之区块链

    初稿 marker 在不久的将来 可见的未来 区块链将深刻的改变我们生活工作交流的方式 不久的将来 可见的未来 我们的社会衡量经济水平的标准或许不是就业人口数量 而是自由职业人口数量 不久的将来 可见的未来 我们的工作合作的关系或许不再有公
  • 关于java中File类的总结

    1 File类只是操作文件 不涉及内容 2 File类的重要方法 设置完整路径 public File String filename 删除文件 public boolean delete 判断文件是否存在 public boolean e
  • Commit message全局安装

    Git Commit Message 全局安装 开发环境 电脑系统 Windows 10 64位系统 调试工具 PowerShell Git cnpm Commit Message 格式 使用 Angular 团队的规范 其Commit M
  • WINDOWS 命令行 串口 COM 发送数据

    WINDOWS 命令 串口 数据 type con gt com1 回车 com1 为想发送的串口 输入字符并回车即可 转载于 https www cnblogs com runliuv p 9817126 html
  • windows10: vscode conda activate CommandNotFoundError

    Windows10 在vscode中自动激活环境报错 CommandNotFoundError 转载自 https www cnblogs com weixia blog p 11408125 html 最近重装了系统 装完anaconda
  • 小程序微信支付

    微信小程序实现支付功能 1 准备工作 在开始实现微信小程序支付功能之前 我们需要先完成以下准备工作 注册微信支付商户号 并完成商户资质审核 微信支付开发文档 在小程序中引入微信支付JSAPI 获取用户的openid 用于发起支付请求 2 支
  • 【Python】模块

    模块 就类似于我们生活中的工具包 Python中的源程序可以作为模块 我们需要使用时 直接将模块导入到我们需要使用的源程序中即可 目录 模块 导入模块 模块导入原理 局部导入 包 包的定义 模块的使用 模块 导入模块 我们导入模块使用的是i
  • Mybatis-Plus查询或更新报错

    报错 Error evaluating expression ew null and ew sqlFirst null Cause org apache ibatis ognl OgnlException sqlFirst 原因 Query
  • SD-WAN与MPLS VPN,MSTP,IPSEC VPN,SSL VPN有什么区别?

    对于目前市场上主流的SD WAN MPLS VPN SSL VPN IPSec VPN和MSTP等企业组网技术 想必大家一定不陌生 其实 MPLS VPN IPSec VPN SSL VPN都属于采用IP VPN技术的产品 IP VPN 虚
  • 重新启动elasticsearch 报错:org.elasticsearch.bootstrap.StartupException: java.lang.IllegalStateException:

    cmd命令重新启动elasticsearch 报错 org elasticsearch bootstrap StartupException java lang IllegalStateException failed to obtain
  • java连接oracle数据库的各种方法及java在数据库中的含义

    java连接oracle数据库的各种方法及java在数据库中的含义 java与oracle的接口 在数据库中运行JAVA可以说是ORACLE8i的最令人激动的新特性 在你创建的使用ORACLE8i 数据库的应用程序中 你可以使用与JAVA有
  • 转载:图像噪声的成因分类与常见图像去噪算法简介

    本文转载自博客园博主淇淇宝贝 图像的空域噪声以及二维降噪算法介绍 1 图像噪声的成因 图像在生成和传输过程中常常因受到各种噪声的干扰和影响而是图像降质 这对后续图像的处理和图像视觉效应将产生不利影响 噪声种类很多 比如 电噪声 机械噪声 信
  • YOLOv5:Profile、Timeout、WorkingDirectory上下文管理器 以及torch.cuda.synchronize()

    相关介绍 Python是一种跨平台的计算机程序设计语言 是一个高层次的结合了解释性 编译性 互动性和面向对象的脚本语言 最初被设计用于编写自动化脚本 shell 随着版本的不断更新和语言新功能的添加 越多被用于独立的 大型项目的开发 Pyt
  • 因果推断(三)——结构因果模型、干预、辛普森悖论

    主要内容 结构因果模型 干预 辛普森悖论 调整公式 结构因果模型 Structural Causal Model SCM 定义 结构因果模型被定义为一个有序三元组