计量经济学学习与Stata应用笔记(五)极大似然估计MLE

2023-10-27

极大似然估计的思想，就是在给定样本值的情况下，构建未知参数的函数，寻找能够使得观测到样本数据的可能性最大的估计参数。
定义似然函数为
L ( θ ; y 1 , ⋯ , y n ) = ∏ i = 1 n f ( y i ; θ ) L(\theta;y_1,\cdots,y_n)=\prod_{i=1}^nf(y_i;\theta) L(θ;y1,⋯,yn)=i=1∏nf(yi;θ)
似然函数与联合密度函数相等，只是似然函数中 θ \theta θ 为自变量。
极大似然估计量为
θ M L ^ = arg max ⁡ ln ⁡ L ( θ ; y ) \hat{\theta_{ML}}=\argmax\ln{L(\theta;y)} θML^=argmaxlnL(θ;y)
该无约束极值问题的一阶条件为
s ( θ ; y ) = ∂ ln ⁡ L ( θ ; y ) ∂ θ = 0 s(\theta;y)=\frac{\partial \ln L(\theta;y)}{\partial\theta}=0 s(θ;y)=∂θ∂lnL(θ;y)=0
对数似然函数的梯度向量为0，称为得分函数。可以证明，得分函数的期望为0。

线性回归模型的极大似然估计

假设线性回归模型为，
y = X β + ϵ \pmb{y=X\beta+\epsilon} y=Xβ+ϵy=Xβ+ϵy=Xβ+ϵ
扰动项符合独立同分布的正态变量。
写出对数似然函数 ln ⁡ L ( β ~ , σ ~ 2 ) \ln L(\tilde {\pmb \beta},\tilde \sigma^2) lnL(βββ~,σ~2)，先计算给定 σ ~ 2 \tilde \sigma^2 σ~2的情况下选择最优 β ~ \tilde {\pmb \beta} βββ~,再带入求得最优 σ ~ 2 \tilde \sigma^2 σ~2。
可以解得
β ~ M L = ( X T X ) − 1 X T y \tilde {\pmb \beta}_{ML}=\pmb {(X^TX)^{-1}X^Ty} βββ~ML=(XTX)−1XTy(XTX)−1XTy(XTX)−1XTy
σ ~ M L 2 = e T e n \tilde \sigma^2_{ML}=\frac{\pmb{e^Te}}{n} σ~ML2=neTeeTeeTe
可以看出MLE对于 β \beta β 的估计与 OLS 是一致的，对于方差的估计则不同，但此差别在大样本下消失。MLE的方差估计量是有偏的，其优点在于大样本性质好。

三类渐进等价的统计检验

对于线性回归模型，检验 H 0 : β = β 0 H_0:\beta=\beta_0 H0:β=β0，其中 β \beta β为位置参数， β 0 \beta_0 β0已知，约束共有 K K K个。

沃尔德检验(Wald test)

通过研究 β \beta β 的无约束估计量 β ^ U \hat \beta_U β^U 与 β 0 \beta_0 β0 的距离来检验。其基本思想是，如果 H 0 H_0 H0正确，则 β ^ U − β 0 \hat \beta_U-\beta_0 β^U−β0的绝对值不应该很大。

似然比检验(LR)

LR检验的基本思想是，如果 H 0 H_0 H0 正确，则 ln ⁡ L ( β ^ U ) − ln ⁡ L ( β 0 ) \ln {L(\hat \beta_U)}-\ln {L(\beta_0)} lnL(β^U)−lnL(β0) 不应该很大。

拉格朗日乘子检验(LM)

考虑有约束条件的对数似然函数最大化问题：
max ⁡ β ~ ln ⁡ L ( β ~ ) s . t . β = β 0 \max_{\tilde \beta}\ln L(\tilde\beta)\\ s.t. \beta=\beta_0 β~maxlnL(β~)s.t.β=β0
引入拉格朗日乘子函数
max ⁡ β ~ , λ ln ⁡ L ( β ~ ) − λ ′ ( β ~ − β 0 ) \max_{\tilde \beta,\lambda}\ln L(\tilde\beta)-\lambda'(\tilde \beta-\beta_0) β~,λmaxlnL(β~)−λ′(β~−β0)
其中， λ \lambda λ 为拉格朗日乘子向量。如果 λ \lambda λ 接近0，则说明此约束条件不 tight，加上这个约束条件并不会使得似然函数的最大值下降很多，说明原假设很可能成立。对 β ~ \tilde \beta β~ 求导，求得一阶极值条件为 λ ^ = ∂ ln ⁡ L ( β ^ R ) ∂ β ~ \hat \lambda =\frac{\partial \ln L(\hat \beta_R)}{\partial \tilde \beta} λ^=∂β~∂lnL(β^R)。LM反应的就是该梯度向量在约束估计量 β ^ R \hat \beta_R β^R 处接近0的程度。

对正态分布假设的检验

QQ plot

将正态分布的分位数与残差的分位数画为散点图，如果残差来自正态分布，则散点应该集中在 y = x y=x y=x 线附近。

正态统计检验

常用的检验方法利用正态分布的偏度和峰度。较常用的雅克-贝拉检验 (JB) 利用偏度和超额峰度的平方加权求和和作为统计量，该统计量服从自由度为2的卡方分布。Stata中的检验方法基于峰度与偏度设计了更复杂的检验统计量。(help sktest)
有时可以通过取对数使变量变得更接近正态分布。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

计量经济学与stata

概率论