【初级计量经济学】内生性问题——工具变量法(Stata实现)

2023-11-10

目录​​​​​​​

1. 数据来源以及变量详目

1.1变量一览表

1.2数据描述性统计

2. 模型设定以及初步回归​​​​​​​

2.1 OLS 模型

2.2 回归结果

2.3 回归结果分析

 3.内生性问题校正

3.1工具变量法

3.2 两阶段最小二乘

3.3  豪斯曼检验(stata手工代码)

3.4  过度识别约束检验(stata手工代码)

4.结果报告

5.总结


1. 数据来源以及变量详目

1.1变量一览表

       实验报告的数据来源于J.M.伍德里奇.计量经济学导论(第三版)中有关已婚女性受教育程度以及工资水平的问题。(这篇报告不涉及exper和expersq,感兴趣的可以做多元回归)

表格1: 部分变量一览表

变量类型

变量简称

变量全称

数据来源

被解释变量

lwage

工资水平的对数

J.M.伍德里奇.计量经济学导论(第三版)

解释变量

educ

受教育水平

exper

工作年数

expersq

工作年数的平方

huseduc

丈夫的受教育水平

motheduc

母亲的受教育水平

1.2数据描述性统计

表格2: 变量描述性统计

         统计量

变量

Obs

Mean

Std.Dev.

Min

Max

lwage

428

1.19

0.72

-2.05

3.22

educ

428

12.65

2.29

5

17

exper

428

13.04

8.06

0

38

expersq

428

234.72

270.04

0

1444

huseduc

428

12.61

3.04

4

17

motheduc

428

9.52

3.31

0

17

use ex1.dta,clear
su

2. 模型设定以及初步回归​​​​​​​

2.1 OLS 模型

lwage = a_0 +a_1 *educ + u       

2.2 回归结果

reg lwage educ

        这里只是演示这个流程,适合初学者自学或者课下再学。没有使用【option】中的robust进行异方差稳健标准误下的回归,请读者自行忽略。

表格3: 初步回归

b/t

lwage

educ

0.109

(7.55)***

_cons

-0.185

(1.00)

R^2

0.12

Prob>F

0.0000***

N

428

**p<0.05

***p<0.01

2.3 回归结果分析

        由回归结果可知,多接受一年教育可以得到10.9%的回报,即已婚职业女性受教育水平每提高一年会使得其工资水平在1%的显著性水平上上涨10.9%。从回归模型中可以推测,随机干扰项u中含有其他影响教育水平的因素,比如个人能力、所在地区、个人智商等因素。从而产生遗漏变量问题,进而违反了经典OLS假设:

cov(educ,u)=0

 3.内生性问题校正

        由上文讨论可知,原模型可能的内生性问题,因此考虑使用工具变量法来校正由此造成的参数估计值的偏误。

3.1工具变量法

​​​​​​​        工具变量法是指当怀疑内生变量存在时,引出一个与该内生变量显著相关但与随机干扰项并不相关的变量来拟合这个内生变量对被解释变量的影响。即该工具变量应该满足以下两个要求:        

        ① cov(Z,x) ≠ 0 ;② cov(Z,μ) = 0 

        通过图示可知:x对y有显著影响,ε和x有显著关系,而X对y也有显著关系,而X并不在回归模型之中,包含在了u之中。如果X与x有显著相关关系,就会导致内生性问题,这是由遗漏变量导致的。而Z与X不相关,Z与μ不相关,但与x有显著相关关系,因此可以用Z来作为工具变量来进行衡量。

       比如,已婚女性薪酬与个人能力、个人智商等变量密切相关,而其受教育水平也与个人能力、个人智商相关。而模型中未加入这些变量,可能是无法测量,或者是没想到可能存在的相关变量。

3.2 两阶段最小二乘

        拟选定huseduc(丈夫的受教育水平)和motheduc(母亲的受教育水平)两个变量作为工具变量来拟合educ(自身受教育水平)对lwage(工资的对数)的影响。利用两阶段回归来探讨。

ivreg lwage (educ = huseduc motheduc),first

        ​​​​​​​       

         可以发现educ与huseduc & motheduc是存在极显著的相关关系的,因此满足第一个适用条件。我们先报告第二阶段回归结果再来进行第二个条件的检验以及判断educ是否为内生性变量的检验。这两个回归报告都可以用上面一行代码进行实现。
        

        再结合结果可知道huseduc和motheduc作为工具变量发现能够极为地显著拟合educ对lwage的影响。但是还没有检验educ的内生性和两个工具变量的外生性。接下来就需要对这两个问题进行检验。分别是豪斯曼检验和过度识别约束检验。

3.3  豪斯曼检验(stata手工代码)

        具体什么是豪斯曼检验笔者会在后续文章中详细介绍。简言之就是判断怀疑的内生变量是否为内生变量的检验方法。

qui reg lwage educ huseduc motheduc 
predict v,residuals
reg lwage educ v
test v=0

        结果报告:

        

         因此拒绝原假设,认为残差的系数不等于0,即原模型中educ和随机扰动项μ显著相关。

3.4  过度识别约束检验(stata手工代码)

         具体什么是过度识别约束检验笔者会在后续文章中详细介绍。简言之就是判断两个工具变量是否是同期外生变量。

qui ivreg lwage (educ=huseduc motheduc)
predict e1,residuals
reg e1 huseduc motheduc
test huseduc=motheduc=0

        结果报告:        

        因此不拒绝原假设,认为huseduc和motheduc的系数同时为0,即两者是同期外生性变量。即满足相关假设。

4.结果报告

表格4: 回归对比

     模型

变量

m_ols

M_2sls

educ

0.109***

0.074***

b/se

(0.014)

(0.227)

cons

-0.185***

0.255***

b/se

(0.185)

(0.289)

       如前文所述,根据初步ols回归结果表示,多接受一年教育可以得到10.9%的回报,即已婚职业女性受教育水平每上涨一年会使得其工资水平在1%的显著性水平上上涨10.9%。而根据IV回归结果,educ的参数估计值在1%的显著性下显著,表明已婚女性受教育水平每提升一年,就会使得其工资上涨7.4%。比OLS估计值低3.5%,这表明初步OLS估计值过高。并且经过豪斯曼检验,educ确实是内生变量;经过过度识别检验,认为huseduc和motheduc同时为外生变量。该工具变量回归能够有效的校正educ的内生性问题并拟合educ对lwage的影响。

5.总结

        ① 工具变量选取

        ② 两阶段最小二乘

        ③ 豪斯曼检验

        ④ 过度识别约束检验

        ⑤ 结果报告

        在最后,笔者是大二经管专业刚接触计量经济学的相关知识,目前在做psm-did,在这方面也仅仅是入门水平,初期文章只适合初学者自学或课后练习。非常希望能在CSDN发文的过程中加深对知识点的理解,和大家共同记录成长过程!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【初级计量经济学】内生性问题——工具变量法(Stata实现) 的相关文章

  • 机器配音在线工具有哪些? 让你的语音合成更自然

    你是不是也想成为一名大博主 随着现在的互联网时代蓬勃发展 出现了一批又一批的网红 在家里带带货 拍拍视频就能赚大钱 越来越多的人朝向网络世界进击 那么这些大博主制作一个爆款视频 必不可少的就是配音啦 但是其实很多博主用的并不是真人配音 而是
  • “性能压测揭密:关键指标分析!“

    在进行全链路压测和性能测试时 需要关注多个关键性能指标 KPIs 来评估系统的性能表现 以下是一些常见的性能测试指标 1 吞吐量 Throughput 系统在单位时间内能够处理的请求数量或事务数量 通常以每秒请求数 RPS TPS 来衡量
  • 处理不舒服的同事关系:实用建议与技巧

    处理不舒服的同事关系 实用建议与技巧 在工作中 我们难免会遇到一些与同事关系不和谐的情况 这些不舒服的关系可能会影响到我们的工作情绪和效率 那么 如何处理这些不舒服的同事关系呢 本文将为你提供一些实用的建议 一 保持冷静和理智 在处理同事关
  • The Planets:Venus

    靶场下载 The Planets Venus VulnHub 信息收集 arp scan l Interface eth0 type EN10MB MAC 00 0c 29 43 7c b1 IPv4 192 168 1 60 Starti
  • 【计算机毕业设计】实验室预约管理

    身处网络时代 随着网络系统体系发展的不断成熟和完善 人们的生活也随之发生了很大的变化 人们在追求较高物质生活的同时 也在想着如何使自身的精神内涵得到提升 而读书就是人们获得精神享受非常重要的途径 为了满足人们随时随地只要有网络就可以看书的要
  • 2024年金三银四网络安全考试试题

    2023年金三银四网络安全考试试题 1 关于数据使用说法错误的是 A 在知识分享 案例中如涉及客户网络数据 应取敏感化 不得直接使用 B 在公开场合 公共媒体等谈论 传播或发布客户网络中的数据 需获得客户书面授权或取敏感化 公开渠道获得的除
  • 挖掘知识的宝藏:如何利用在线资源提升个人技能

    在这个信息爆炸的时代 互联网已经成为我们获取知识 提升技能的重要途径 无论是学习编程 提高语言能力 还是了解新的行业趋势 网络资源都为我们提供了无限可能 本文将探讨如何有效利用在线资源进行自我提升 一 选择合适的在线学习平台 首先 我们需要
  • 语音翻译软件app哪家好?帮你和外国人无碍交流的软件分享

    在和外国人交流的时候发现听不懂怎么办 还能怎么办 谁让我们的英语没学好呢 这种时候还是得寻求其他人的帮助 不过万一要是在只有你一个人的情况下又怎么办呢 俗话说 求人不如求己 那还是得在自己手机里时刻准备好能够翻译英语的工具呀 今天就给大家分
  • 像素高低:影响照片质量、分辨率与细节表现的奥秘

    在数字摄影时代 像素成为了衡量照片质量的重要标准之一 那么 什么是像素 像素的高低又如何影响照片的质量 分辨率和细节表现呢 本文将为您揭开这个奥秘 首先 我们来了解一下像素的基本概念 像素 Pixel 是组成数字图像的基本单元 通常由字母
  • 【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
  • 如何正确使用RC滤波网络

    众所周知 最有效的滤波电路应靠近噪声源放置 滤波的作用是对噪声电流进行及时有效地阻止和转移 实际设计中 工程师经常使用高的串联阻抗 电阻 电感和铁氧体 阻止电流 并使用低的并联阻抗 电容 转移电流 通常情况下 我们期望滤波器可以对噪声信号衰
  • 为什么这么多人自学黑客,但没过多久就放弃了(掌握正确的网络安全学习路线很重要)

    网络安全是一个 不断发展和演变 的领域 以下是一个 网络安全学习路线规划 旨在帮助初学者快速入门和提高自己的技能 基础知识 网络安全的 基础知识 包括 网络结构 操作系统 编程语言 等方面的知识 学习这些基础知识对理解网络安全的原理和技术至
  • 【js学习之路】遍历数组api之 `filter `和 `map`的区别

    一 前言 数组是我们在项目中经常使用的数据类型 今天我们主要简述作用于遍历数组的api filter 和 map 的区别 二 filter和map的共同点 首先 我们主要阐述一下 filter 和 map 的共同点 api的参数都是回调函数
  • 在双边案例交叉设计中创建控制日期

    我计划研究空气污染对急诊室就诊的影响 并打算使用双边病例交叉设计 对于每个病例 医院就诊 我想创建 4 个控制日期 就诊前后 7 天和 14 天 例如 如果一个人于 2012 年 9 月 10 日访问诊所 我的控制日期将为 8 月 27 日
  • R 与 Stata 中的 Cox 比例风险模型

    我正在尝试使用以下数据在 R 中复制 Stata 的 cox 比例风险模型估计http iojournal org wp content uploads 2015 05 FortnaReplicationData dta http iojo
  • 如何在 Stata 中查找并替换字符串变量的一部分?

    我正在使用一个基本上是 URL 的变量 所以观察结果包括像这样的值 www google com https www google com https yahoo movies com 我正在尝试创建一个 do 文件以将一堆这些文件导入到
  • 如何获取完整的子目录列表(包括子目录的子目录)?

    我有数千个城市文件夹 例如city1 city2等等 但实际上命名为NewYork Boston ETC 每个文件夹还包含两个子文件夹 land and house 所以目录结构是这样的 current dictionary city1 h
  • 在 Sublime Text 3 中,我可以将 do 文件的选择发送到 Stata 吗?

    This SO question https stackoverflow com questions 18361667 is there a command line editor that highlights the stata syn
  • 哪些类型的语言允许以编程方式创建变量名称?

    这个问题纯粹出于求知欲 在相对频繁地浏览 Python 部分后 我看到了许多类似的问题this https stackoverflow com questions 1429814 how to programmatically set a
  • 将多个文件读取到多个数据框中

    在d 文件夹中 我有很多Stata文件 例如data aa 1 dta data aa 2 dta data aa 3 dta data bb 1 dta data bb 2 dta data bb 3 dta data cc 1 dta

随机推荐

  • 网络编程的无冕之王-Netty入门和核心组件介绍

    最近我在研究Netty 之前只是经常听说 并没有实际做过研究 为什么突然要好好研究一下它 主要是因为前段时间 我在看RocketMQ底层原理的时候发现它的底层的网络通信都是基于Netty 然后网上一查 果然 大家太多的耳熟能详的工具组件 都
  • 物理射线、导航网格寻路

    每日一句 努力追上你的每天都是美好的 因为未来可期 目录 射线检测 需求1 物体射线到一定距离会改变物体状态 降落伞 需求2 鼠标点哪走哪 寻路 射线 点击小地图 人物到达指定位置 需求3 做准心效果 射线碰到物体有UI跟随效果 寻路系统
  • C语言绘图EasyX图形库基础(笔记)

    在电脑已经安装了vs编译器的情况下在浏览器输入EasyX的官网网址http easyx cn下载EasyX图形库根据安装提示对应VS版本安装即可 EasyX cpp 此文件包含 main 函数 程序执行将在此处开始并结束 在电脑已经安装了v
  • 【前端】node、npm、pnpm部署react项目过程中问题记录

    最近在重新部署一个前后端分离的项目时 在前端环境这里遇到了一些麻烦 通过百度找到的node npm pnpm的处理情况不尽相同 没能很准确地解决到问题 经过多次的尝试才自己得到结论 现在记录一下操作过程中遇到的问题 1 目标是成功安装pnp
  • this action could not be completed. Try again

    问题描述 直接在organiser点击upload to app store出现 this action could not be completed Try again 解决办法 1 打开xcode 2 选择xcode gt open d
  • 基于Ambari 2.6 hdp2.6 集成Redis5.0.0

    1 将Redis组件纳入Amabri集群 查看hdp版本 hdp select status hadoop client 得到hadoop client 2 6 5 0 292 可知hdp版本为2 6 主节点上 cd var lib amb
  • Elasticsearch 搜索数量不能超过10000的解决方案

    目录 一 问题描述 二 问题分析 三 解决方案 3 1 调大index max result window 不推荐 3 2 cardinality 不推荐 3 3 track total hits 推荐 一 问题描述 开发环境 JDK1 8
  • 【STM32F4】STM32F407+ESP8266连接机智云过程详解

    要求 通过手机上的机智云通用APP 点亮开发板载LED0 LED1 摘要 硬件组成 STM32F407ZGT6 esp8266 乐鑫 软件APP 机智云开发都者中心下载的通用APP Demo Xcom串口调试助手 Keil V5 调试过程详
  • mui实现表格

    mui的css文档中没有向bootstrap中类似的写好的样式供调用 但是用table显示表格本身就不难看 再写一些CSS类完全可以放到网页中 下面提供代码
  • ROS2中创建 Python 和 C++包

    创建 Python 包 在本教程中 您将学习如何创建和设置 ROS2 Python 包 我将向您展示每一步 并解释文件之间的关系 在哪里编写节点 如何添加启动文件等 设置 ROS2 Python 包 Python包内文件说明 package
  • 进程管理详解

    1 进程 进程就是出于执行期的程序 但是进程并不仅仅局限于一段可执行的代码 通常进程还要包括其他资源 像打开的文件 挂起的信号 内核内部数据 处理器状态 一个或多个具有内存映射的内存地址空间及一个或多个执行线程 当然还包括用来存放全局变量的
  • idea工具基础配置(Mac)

    用于个人在初次使用idea时 做一些基础配置 便于后续快速开发 此文章不涉及快捷键设置 若需要快捷键设置可查看其他链接 idea Mac 快捷方式设置 快捷键改为eclipse 1 idea背景颜色 intelliJ IDEA gt pre
  • (每日一练)MATLAB数据拟合

    今天就的学习内容是数据拟合 数据拟合也称为曲线拟合 是一种把现有数据透过数学方法来代入一条数式的表示方式 科学和工程问题可以通过诸如采样 实验等方法获得若干离散的数据 根据这些数据 我们往往希望得到一个连续的函数 也就是曲线 或者更加密集的
  • SpringMVC学习笔记

    springMVC简单入门 快速搭建 pom xml依赖
  • JQuery DOM

    操作文本 常用方法 代码实现 div 我是div div
  • 用Python赚钱的4个大招,女程序员做副业躺赚

    关于穷 去年有了一个更学术的说法 隐形贫困人口 就是因为有太多 种草达人 让我们为了物质生活超前消费 再加上不理财的话 那简直是雪上加霜 看到知乎上面最近有一个很火的问题 90后的你 现在拥有多少存款 你会看到人生百态 有人父母双亡 白手起
  • Docker : Docker镜像的分层结构

    1 美图 2 概述 3 base镜像 base 镜像简单来说就是不依赖其他任何镜像 完全从0开始建起 其他镜像都是建立在他的之上 可以比喻为大楼的地基 docker镜像的鼻祖 base 镜像有两层含义 不依赖其他镜像 从 scratch 构
  • Github 如何设置 master 为默认分支

    起因 github 新版本上线之后 原默认分支为 master 现在统一改为了 main 我不禁产生疑问 为什么要改呢 原因大概是漂亮国农奴历史遗留问题导致的 master 奴隶主 slaver 奴隶 解决方法 我们已经习惯以 master
  • 算法:优先队列-理论

    目录 优先队列 我们平时比较常见的优先队列的场景有什么 优先队列的实现机制 java的优先队列是怎么实现的 优先队列 我们先回忆一下什么是队列 队列 一种先进先出的数据结构 主要关注点在于先入的元素
  • 【初级计量经济学】内生性问题——工具变量法(Stata实现)

    目录 1 数据来源以及变量详目 1 1变量一览表 1 2数据描述性统计 2 模型设定以及初步回归 2 1 OLS 模型 2 2 回归结果 2 3 回归结果分析 内生性问题校正 1工具变量法 2 两阶段最小二乘 3 豪斯曼检验 stata手工