计量经济学学习与Stata应用笔记(五)极大似然估计MLE

2023-10-27

极大似然估计的思想,就是在给定样本值的情况下,构建未知参数的函数,寻找能够使得观测到样本数据的可能性最大的估计参数。
定义似然函数为
L ( θ ; y 1 , ⋯   , y n ) = ∏ i = 1 n f ( y i ; θ ) L(\theta;y_1,\cdots,y_n)=\prod_{i=1}^nf(y_i;\theta) L(θ;y1,,yn)=i=1nf(yi;θ)
似然函数与联合密度函数相等,只是似然函数中 θ \theta θ 为自变量。
极大似然估计量为
θ M L ^ = arg max ⁡ ln ⁡ L ( θ ; y ) \hat{\theta_{ML}}=\argmax\ln{L(\theta;y)} θML^=argmaxlnL(θ;y)
该无约束极值问题的一阶条件为
s ( θ ; y ) = ∂ ln ⁡ L ( θ ; y ) ∂ θ = 0 s(\theta;y)=\frac{\partial \ln L(\theta;y)}{\partial\theta}=0 s(θ;y)=θlnL(θ;y)=0
对数似然函数的梯度向量为0,称为得分函数。可以证明,得分函数的期望为0。

线性回归模型的极大似然估计

假设线性回归模型为,
y = X β + ϵ \pmb{y=X\beta+\epsilon} y=Xβ+ϵy=+ϵy=Xβ+ϵ
扰动项符合独立同分布的正态变量。
写出对数似然函数 ln ⁡ L ( β ~ , σ ~ 2 ) \ln L(\tilde {\pmb \beta},\tilde \sigma^2) lnL(βββ~,σ~2),先计算给定 σ ~ 2 \tilde \sigma^2 σ~2的情况下选择最优 β ~ \tilde {\pmb \beta} βββ~,再带入求得最优 σ ~ 2 \tilde \sigma^2 σ~2
可以解得
β ~ M L = ( X T X ) − 1 X T y \tilde {\pmb \beta}_{ML}=\pmb {(X^TX)^{-1}X^Ty} βββ~ML=(XTX)1XTy(XTX)1XTy(XTX)1XTy
σ ~ M L 2 = e T e n \tilde \sigma^2_{ML}=\frac{\pmb{e^Te}}{n} σ~ML2=neTeeTeeTe
可以看出MLE对于 β \beta β 的估计与 OLS 是一致的,对于方差的估计则不同,但此差别在大样本下消失。MLE的方差估计量是有偏的,其优点在于大样本性质好。

三类渐进等价的统计检验

对于线性回归模型,检验 H 0 : β = β 0 H_0:\beta=\beta_0 H0:β=β0,其中 β \beta β为位置参数, β 0 \beta_0 β0已知,约束共有 K K K个。

沃尔德检验(Wald test)

通过研究 β \beta β 的无约束估计量 β ^ U \hat \beta_U β^U β 0 \beta_0 β0 的距离来检验。其基本思想是,如果 H 0 H_0 H0正确,则 β ^ U − β 0 \hat \beta_U-\beta_0 β^Uβ0的绝对值不应该很大。

似然比检验(LR)

LR检验的基本思想是,如果 H 0 H_0 H0 正确,则 ln ⁡ L ( β ^ U ) − ln ⁡ L ( β 0 ) \ln {L(\hat \beta_U)}-\ln {L(\beta_0)} lnL(β^U)lnL(β0) 不应该很大。

拉格朗日乘子检验(LM)

考虑有约束条件的对数似然函数最大化问题:
max ⁡ β ~ ln ⁡ L ( β ~ ) s . t . β = β 0 \max_{\tilde \beta}\ln L(\tilde\beta)\\ s.t. \beta=\beta_0 β~maxlnL(β~)s.t.β=β0
引入拉格朗日乘子函数
max ⁡ β ~ , λ ln ⁡ L ( β ~ ) − λ ′ ( β ~ − β 0 ) \max_{\tilde \beta,\lambda}\ln L(\tilde\beta)-\lambda'(\tilde \beta-\beta_0) β~,λmaxlnL(β~)λ(β~β0)
其中, λ \lambda λ 为拉格朗日乘子向量。如果 λ \lambda λ 接近0,则说明此约束条件不 tight,加上这个约束条件并不会使得似然函数的最大值下降很多,说明原假设很可能成立。对 β ~ \tilde \beta β~ 求导,求得一阶极值条件为 λ ^ = ∂ ln ⁡ L ( β ^ R ) ∂ β ~ \hat \lambda =\frac{\partial \ln L(\hat \beta_R)}{\partial \tilde \beta} λ^=β~lnL(β^R)。LM反应的就是该梯度向量在约束估计量 β ^ R \hat \beta_R β^R 处接近0的程度。

对正态分布假设的检验

QQ plot

将正态分布的分位数与残差的分位数画为散点图,如果残差来自正态分布,则散点应该集中在 y = x y=x y=x 线附近。

正态统计检验

常用的检验方法利用正态分布的偏度和峰度。较常用的雅克-贝拉检验 (JB) 利用偏度和超额峰度的平方加权求和和作为统计量,该统计量服从自由度为2的卡方分布。Stata中的检验方法基于峰度与偏度设计了更复杂的检验统计量。(help sktest)
有时可以通过取对数使变量变得更接近正态分布。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计量经济学学习与Stata应用笔记(五)极大似然估计MLE 的相关文章

  • 随机事件及其概率(一):

    一 事件的关系和运算 事件的和 并 事件A 与事件B 中至少有一个事件发生 这个事件称为事件A与B 的和事件 记做 例如一件事 它发生有两种方案 就可以并起来 因为他们之和是发生这件事的总概率 事件的积 交 事件A和事件B同时发生 即事件A
  • 常用的概率分布:伯努利分布、二项分布、多项式分布、高斯分布、指数分布、拉普拉斯分布和Dirac-delta分布

    伯努利分布 Bernoulli distribution 伯努利分布 单个二值随机变量的分布 由单个参数 0 1 控制 例 抛硬币 正面朝上的概率 二项式分布 binomial distrubution 二项式分布 在n次试验中事件A恰好发
  • Applications(4)

    CONTENTS Other Applications In this section we cover a few other types of applications of deep learning that are differe
  • [洛谷] [NOIP2018 提高组] 旅行 加强版 - 基环树

    题目链接 https www luogu com cn problem P5049 题目描述 小 Y 是一个爱好旅行的 OIer 她来到 X 国 打算将各个城市都玩一遍 小Y了解到 X国的 n 个城市之间有 m 条双向道路 每条双向道路连接
  • 全概率公式习题

    简单的记录下关于全概率公式的习题 我们可以先看下抓阄不分先后的一个例子 设袋中装有10个阄 其中8个是白阄 2个是有物之阄 甲 乙二人依次抓取一个 求没人抓得有物之阄的概率 设A B分别为甲 乙抓得有物之阄的事件 显然P A 2 10 下面
  • 伪似然估计(Pseudo Maximum Likelihood Estimation)

    伪似然估计 和 剖面似然估计 伪似然估计 参考文献 Gong G and Samaniego F J 1981 pseudo Maximum Likelihood Estimation Theory and Applications The
  • 【Basis】变分推断以及VIEM

    在包含隐变量 latent variables 的推断问题中 针对连续性随机变量的情况 隐变量的高维以及被积函数 intergrand 的复杂度使积分 intergration 无法进行 而针对离散型随机变量 隐变量呈指数 exponent
  • 一维随机变量的常见分布、期望、方差及其性质与推导过程

    文章目录 必须知道的概率论知识 一维变量 离散随机变量 def 常见分布 几何分布 期望 方差 二项分布 b n p 期望 方差 泊松分布 P
  • leetcode刷题(四)——概率论与数理统计(一)

    leetcode刷题系列四 主要的内容涉及概率论和数理统计的知识 例题 算法分析 int dp 12 70 double dicesProbability int n int returnSize int i j k double f do
  • 非中心卡方分布

    非中心卡方分布 非中心卡方分布是卡方分布的一般化形式 如果 是 个独立的正态分布的随机变量均值为 方差为 表示为 那么随机变量 为非中心卡方分布 非中心卡方分布涉及两个参数 表示自由度 即 的数目 是和随机变量 相关的参数 由以上参数所定义
  • 蓝桥杯历届试题-小朋友排队

    题目 题目链接 题解 树状数组求逆序对 好早之前写过逆序对的三种求法 看明白了树状数组求逆序对的方法后本题就很轻松了 本题思路 高矮不满足要求的相邻两个小朋友要互换位置 且二者的不高兴程度都是增加 所以对于某个小朋友而言 其左侧的高个会与其
  • 计量经济学学习与Stata应用笔记(二)小样本最小二乘法

    最小二乘法 OLS 是最基本的线性回归模型估计方法 小样本OLS 古典线性回归模型假定 古典线性回归模型有以下几个假定 线性假定 总体模型为 y i 1
  • 【自然语言处理】隐马尔可夫模型【Ⅵ】精度问题

    有任何的书写错误 排版错误 概念错误等 希望大家包含指正 由于字数限制 分成六篇博客 自然语言处理 隐马尔可夫模型 马尔可夫模型 自然语言处理 隐马尔可夫模型 隐马尔科夫模型概述 自然语言处理 隐马尔可夫模型 估计问题 自然语言处理 隐马尔
  • VAE(变分自编码器) 详解

    近期看论文要用到VAE 看了很多资料 有这样一种感觉 要么过度过于偏向数学原理 要么只是讲了讲网络结构 本文将两者结合 以简洁易懂的语言结合代码实现来介绍VAE 1 解决问题 VAE是变分推断 variational inference 以
  • 第八章 假设检验

    目录 一 假设检验的基本概念 假设及假设检验的定义 原假设与备择假设 基本思想 接受域与拒绝域 假设检验的分类 两类错误 二 一个正态总体下的参数假设检验 期望 方差的假设检验 三 两个正态总体下的参数假设检验 期望的差异性 方差的差异性的
  • 西瓜+南瓜-task1 模型评估与选择

    题外话 南瓜书是西瓜书公式的进一步深入 机器学习研究什么 对历史经验的归纳总结 预测 比如 早霞不出门晚霞行千里 通过历史累计 经验 预测第二天是晴天还是雨天 此处的 经验 类似于历史数据 通过学习数据 或者训练数据 提前预判 这就是机器学
  • 布隆过滤器(Bloom Filter)

    1 引言 通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景 一般想到的是将集合中所有元素保存起来 然后通过比较确定 链表 树 散列表 又叫哈希表 Hash table 等等数据结构都是这种思路 但是随着集合中元素的增加 我们需要的
  • 多维随机变量及其分布(四):

    一 二维随机变量及其分布函数 1 二维随机变量 设随机变量 Z X Y 则有 Z X Y 一个随机变量是有两个随机变量决定的 2 联合分布函数的基本性质 单调性 F x y 分别对x 或y是单调不减的 即 对任意固定的y 当 x1 lt x
  • 2021.9.5笔试题

    第一题 题目 找x y target 数字特别大 可能会溢出 代码 include
  • 自信息量和一阶熵

    信息论中 自信息量和一阶熵是用来度量信息的重要概念 它们提供了一种方式来理解和量化信息的不确定性和平均量 对于解决信息传输 编码和存储等问题非常有用 首先 让我们来了解一下自信息量 自信息量是用来度量一个事件的信息量或不确定性的大小 假设有

随机推荐

  • ansible批量添加用户账户密码

    一 批量添加root用户以及密码 首先批量添加root 账号密码 不用ssh copy id root ip地址 因为如果ip比较多的情况下 ssh脚本添加会特别的麻烦 步骤1 首先要配置ansible清单 远程主机的密码这里为 12345
  • Idea上传已有项目到git

    开发经常遇到的问题是开发初期没有建立GIT仓库 开发一段时间后 需要将已有代码上传到Git 怎么将已有项目与新建的Git仓库相关联呢 借助Idea可以轻松实现 1 首先使用Git命令行 git clone XXXXX git 将项目下载 2
  • JAVA控制台输出格式

    public class PrintFormat public static void main String args Console print format System out printf format args format为指
  • Python键鼠操作自动化库PyAutoGUI简介

    PyAutoGUI是一个Python语言的键鼠自动化库 简单来说和按键精灵的功能一样 但是因为是Python的类库 所以可以使用Python代码配合一些其他类库完成更加强大的功能 下面让我为大家介绍一下吧 安装 从pip安装即可 pip i
  • 【threejs 】添加标签和射线

    three 添加标签 应用 上一篇文章我们说了世界坐标和屏幕坐标的准换那么有什么应用呢 应用 可以实现该效果 鼠标移动该模块的时候展示该模块的标签 或者可以常显 射线就是当鼠标移动到该模块该模块变化颜色 创建一个标签js文件作为封装的方法
  • 深入理解文字高度和行高的设置

    font size设置的是什么 line height设置的是什么 各种行高是怎么计算出来的 你真的知道吗 1 从font size讲起 说文字高度 当你按住鼠标左键选中一段文字的时候 这段文字背后会有一个颜色变化的区域 这个区域可以近似的
  • 零基础开发WIFI设备(esp8266)

    目录 前言 一 本例程实现功能 二 Core提供的TCP功能介绍 三 接线图 四 材料清单 五 完整代码 通过IP地址和服务器建立连接 代码运行结果 前言 shineblink core 开发板 简称Core 的库函数支持WIFI功能 所以
  • 将websocket通信端口代理到TCP通信端口的方法记录

    websocketproxy代理服务基于go语言实现 功能描述 Proxy of gateway Websockt transfer TCP protocol Websocket gt TCP TCP gt Websocket 即 实现将w
  • 禅道项目管理系统RCE漏洞复现+利用

    1 漏洞概述 禅道研发项目管理软件是国产的开源项目管理软件 专注研发项目管理 内置需求管理 任务管理 bug管理 缺陷管理 用例管理 计划发布等功能 实现了软件的完整生命周期管理 2023年1月6日 互联网披露其旧版本中存在权限绕过与命令执
  • 编写一个方法,将字符串中的空格全部替换为“%20”

    请编写一个方法 将字符串中的空格全部替换为 20 假定该字符串有足够的空间存放新增的字符 并且知道字符串的真实长度 小于等于1000 同时保证字符串由大小写的英文字母组成 给定一个string iniString 为原始的串 以及串的长度
  • 杂凑密码——摘要算法简介

    概念 密码杂凑函数 Cryptographic hash function 又称为密码散列函数 加密散列函数 散列函数的一种 杂凑函数是一种单向函数 要由散列函数输出的结果 回推输入的资料是什么 是非常困难的 散列函数的输出结果 被称为讯息
  • Kotlin inline 关键字

    文章目录 前言 一 inline 是什么 二 未使用 2 使用后 总结 前言 最近又到了面试的季节 今天在面试中被问到了kotlin inline 关键字 感觉回答的不是很好 今天研究一下它 一 inline 是什么 inline 是kot
  • k8s源码解析 - 如何使用yaml创建k8s的资源

    如何初始化k8s中的client 1 kubernetes Clientset 参考链接 集群内访问创建k8s client 直接获取集群内的config 通过config创建clientSet creates the in cluster
  • postconstruct不执行_Spring Boot 应用在启动阶段执行代码的几种方式

    前言 有时候我们需要在应用启动时执行一些代码片段 这些片段可能是仅仅是为了记录 log 也可能是在https dayarch top p pkix certificate import html 诸如上述业务要求我们可能会经常碰到 Spri
  • C# Linq源码分析之Take(五)

    概要 本文在C Linq源码分析之Take 四 的基础上继续从源码角度分析Take的优化方法 主要分析Where Select Take的使用案例 Where Select Take的案例分析 该场景模拟我们显示中将EF中与数据库关联的对象
  • UTF8 到GB2312 的 转换

    这段代码不仅仅是含有UTF8到Unicode的转换 还包括Gb2312 Unicode 到Gb2312 如过不使用Windows API的话 那么自己因该建立一个转化表 这样效率才会好 因为我一时没有找到这种表 如果谁有请贴上来 谢谢 in
  • 快手__nsTokensig和sig签名算法分析

    一 nstokensig签名 最近在学习android逆向 不足之处欢迎大佬多多指点 这次分析的是快手极速版1 2 2 8 使用Fiddler抓包发现有2个签名 一个是 nstokensig和sig 通过jadx gui搜索字符串找到nst
  • MATLAB数值计算——矩阵运算乘法、除法、乘方

    一 矩阵 矩阵是线性代数的基本单元 矩阵含有M行N列数值 矩阵中的元素可以是实数或复数 矩阵相关的基本运算 加 减 内积 逆矩阵 转置 线性方程式 特征值 特征向量 矩阵分解 二 矩阵的运算 2 1 矩阵的乘法运算 运算符 矩阵乘法 矩阵对
  • catalog java,Java Connection getCatalog()方法与示例

    通常 目录是一个目录 其中包含有关数据集 文件或数据库的信息 而数据库目录中包含所有数据库 基本表 视图 虚拟表 同义词 值范围 索引 用户和用户组的列表 Connection接口的getCatalog 方法返回当前连接对象的当前目录 数据
  • 计量经济学学习与Stata应用笔记(五)极大似然估计MLE

    极大似然估计的思想 就是在给定样本值的情况下 构建未知参数的函数 寻找能够使得观测到样本数据的可能性最大的估计参数 定义似然函数为 L y 1