- 向前/后逐步回归筛选自变量
- 检验自变量之间是否多重共线性(计算VIF)
- 内生性、核心变量与解释变量
- 虚拟变量,个数 = 分类数 - 1,否则有多重共线性
- stata软件
- 回归模型假设检验、回归系数假设检验与解释
- 自变量对因变量的影响程度:标准化回归系数
- 检验异方差(原始数据分布极其不均匀时可能有),作残差与拟合值、自变量图,波动很大
目录
回归的思想
回归分析的任务
多元线性回归需要的数据
数据类型
数据来源网站
一元线性回归
遗漏变量导致的内生性
核心解释变量、控制变量
回归系数的解释
含对数的模型
虚拟变量
含有交互项的自变量
回归实例
Stata 数据的描述性统计
定量数据
定性数据
Stata 进行回归计算
计算出拟合优度很低怎么办?
Stata 加入虚拟变量的回归
标准化回归系数
扰动项必须是球型扰动项
异方差
异方差产生原因
异方差的后果
检验异方差
通过作图观察
BP假设检验
怀特假设检验
异方差的处理方法
OLS+稳健标准误
多重共线性
多重共线性引起的问题
检验多重共线性
处理方法
逐步回归分析
回归的思想
五类常见的回归分析:划分依据是因变量Y的类型
![](https://img-blog.csdnimg.cn/3151bf8f37ce46fca2a73aa438488314.png)
生存变量:对于活着的事物不能知道其寿命,所以以当前寿命作为寿命,截断数据
回归分析的任务
通过研究自变量 X 和因变量 Y 的相关关系,解释Y的形成机制,通过X预测Y
- 变量选择:识别哪些X变量与Y有关
- 判断X与Y的相关性方向:正/负
- 估计X的权重(回归系数,即自变量的系数),即X对Y的影响有多大
多元线性回归需要的数据
数据类型
![](https://img-blog.csdnimg.cn/1a422377692c4d9789f6a1f287c4930b.png)
- 横截面数据:在某一时点收集的不同对象的数据(全国各省份2018年GDP的数据)
- 时间序列数据:对同一对象在不同时间连续观察所取得的数据(中国历年来GDP的数据)
- 面板数据:横截面数据与时间序列数据综合起来的一种数据资源(2008‐2018年,我国各省份GDP的数据)
(前两种常用)
数据来源网站
宏观数据(国家等大的层面)、微观数据(企业、个人等)
![](https://img-blog.csdnimg.cn/54449b739fed4ecdbcbd7f30717be3c8.png)
一元线性回归
![](https://img-blog.csdnimg.cn/f3d6bf729d8a42b9883b6f9b0fab867b.png)
![](https://img-blog.csdnimg.cn/b152598254f04207894b57b3587797bd.png)
遗漏变量导致的内生性
回归模型具有外生性:误差项 μ 和所有的自变量不相关
回归模型具有内生性:误差项 μ 和自变量有相关性(即 μ 中包含了所有与y相关,但未添加到回归模型中的变量,如果这些变量和已经添加的自变量相关,则存在内生性),内生性导致回归系数不准确(不满足无偏性、一致性)
![](https://img-blog.csdnimg.cn/5d5ca8a9b773432b98be2526db265680.png)
核心解释变量、控制变量
严格外生性,即无内生性(no endogeneity),要求所有解释变量均与扰动项不相关,很难满足,因此弱化这个条件:将变量分为核心解释变量、控制变量
在实际应用中,只要保证核心解释变量与
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)