干货

2023-10-26

源于频率主义学派的极大似然估计(Maximum Likelihood Estimation,简称MLE),是根据数据采样来估计概率分布参数的经典方法,在机器学习的对数几率回归、贝叶斯分类器等中有广泛的应用。

1 极大似然估计法

设总体的概率密度函数(或分布律)为 f ( y , w 1 , w 2 , … , w k ) , y 1 , y 2 , … , y m f\left(y, w_{1}, w_{2}, \ldots, w_{k}\right), y_{1}, y_{2}, \ldots, y_{m} f(y,w1,w2,,wk),y1,y2,,ym为从该总体中抽出来的样本。英文 y 1 , y 2 , … , y m y_{1}, y_{2}, \dots, y_{m} y1,y2,,ym相互独立同分布,于是,它们的联合概率密度函数(或联合概率)为
L ( y 1 , y 2 , … , y m ; w 1 , w 2 , … , w k ) = ∏ i = 1 m f ( y i , w 1 , w 2 , … , w k ) L\left(y_{1}, y_{2}, \ldots, y_{m} ; w_{1}, w_{2}, \ldots, w_{k}\right)=\prod_{i=1}^{m} f\left(y_{i}, w_{1}, w_{2}, \ldots, w_{k}\right) L(y1,y2,,ym;w1,w2,,wk)=i=1mf(yi,w1,w2,,wk)
其中, w 1 , w 2 , … , w k w_{1}, w_{2}, \ldots, w_{k} w1,w2,,wk被看作固定但是未知的参数。当我们已经观测到一组样本观测值 y 1 , y 2 , … , y m y_{1}, y_{2}, \dots, y_{m} y1,y2,,ym时,要去估计未知参数,一种直观的想法就是,哪一组参数值使得现在的样本观测值出现的概率最大,哪一组参数可能就是真正的参数,我们就用它作为参数的估计值,这就是所谓的极大似然估计。

2 对数似然函数

通常记 L ( y 1 , y 2 , … , y m ; w 1 , w 2 , … , w k ) = L ( w ) L\left(y_{1}, y_{2}, \dots, y_{m} ; w_{1}, w_{2}, \dots, w_{k}\right)=L(w) L(y1,y2,,ym;w1,w2,,wk)=L(w),并称其为似然函数。于是求 w w w的极大似然估计就归结为求 L ( w ) L(w) L(w)的最大值点。由于连乘容易导致下溢,通常使用对数似然函数(log-likelihood)。
ln ⁡ L ( w ) = ln ⁡ ( ∏ i = 1 m f ( y i , w 1 , w 2 , … , w k ) ) = ∑ i = 1 m ln ⁡ f ( y i , w 1 , w 2 , … , w k ) \ln L(\boldsymbol{w})=\ln \left(\prod_{i=1}^{m} f\left(y_{i}, w_{1}, w_{2}, \ldots, w_{k}\right)\right)=\sum_{i=1}^{m} \ln f\left(y_{i}, w_{1}, w_{2}, \ldots, w_{k}\right) lnL(w)=ln(i=1mf(yi,w1,w2,,wk))=i=1mlnf(yi,w1,w2,,wk)
由于对数似然函数是单调递增函数,其与 L ( w ) L(\boldsymbol{w}) L(w)有相同的最大值点。则求解 L ( w ) L(\boldsymbol{w}) L(w)最大值点就转化为求 ln ⁡ L ( w ) \ln L(\boldsymbol{w}) lnL(w)的最大值点,对于凸函数而言就很简单了。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

干货 的相关文章

随机推荐

  • 3 个 C 程序示例,用于创建包含数据的文件

    本教程介绍如何使用 C 程序创建文件 在这些示例中 我们将创建新的 HTML 文件并向其中写入一些内容 文件的内容会有所不同 但这三个 C 示例程序应该向大家说明如何使用 fopen fprintf 等 c 文件函数来创建和操作文件 示例一
  • ibm中间键服务器缺少文件夹,存储中间件-MQ常见问题解决方法FAQ.doc

    存储中间件 MQ常见问题解决方法FAQ IBM Websphere MQ FAQ Last Release 2006 1 2 这里整理了IBM Websphere MQ的一些常见错误和解决方法 当发现MQ错误而一时无法解决时 可以参阅这里的
  • 【LibTorch】C++中部署TorchScript模型

    文章目录 1 LibTorch安装 2 C 调用PyTorch模型 2 1 Python中保存tensor数据 2 2 C 中保存tensor数据 2 3 C 加载tensor并调用模型 3 编译执行C 推理用例 3 1 编写CMakeLi
  • Kali配置SSH服务,并且通过Xshell远程登录

    在很多时候 需要通过远程登录到Kali主机进行操作 什么是SSH SSH 为建立在应用层基础上的安全协议 SSH 是较可靠 专为远程登录会话和其他网络服务提供安全性的协议 利用 SSH 协议可以有效防止远程管理过程中的信息泄露问题 1 配置
  • 把正整数数组里面的数字组合成最小的数字

    题目描述 把数组里所有数字拼接起来排成一个数 打印能拼接出的所有数字中最小的一个 例如输入数组 7 302 12 则打印出这三个数字能排成的最小数字为123027 题目分析 需要打印出三个数字可以排成的最小数字 表明算法涉及全排列 算法设计
  • VSCode之C++ & CUDA极简环境配置

    背景 想要了解CUDA并行计算原理 同时针对深度学习中出现一些 不支持算子 可能需要手写的需要 配置一个简单的CUDA编译环境 探索CUDA编程的范式 注 CUDA环境配置略 结果展示 示例代码 include cuda runtime h
  • Open3D 点云按高程进行渲染赋色

    目录 一 概述 二 代码实现 三 结果展示 一 概述 如题 使用Open3D内置函数来基于点云的高程对点云进行颜色渲染赋值 其结果如下图所示 此外 还可以根据颜色配赋表选择任意形式的渲染效果 附 配赋表 二 代码实现 import nump
  • 文本情感分析当前研究热点

    先介绍文本情感分析主要的数据集 Stanford Sentiment Treebank 11855个句子划分为239231个短语 每个短语有个概率值 越小越负面 越大越正面链接 IMDB 100 000句子 正面负面两类链接 附LSTM和C
  • 使用datetime库,对当前日期输出3种不同日期输出方法。

    import datetime import time print datetime date today print time strftime Y m d time localtime time time 更详细time strftim
  • [Linux] 多网卡主机之间指定双方通信网卡的办法

    一 Linux 下使用router 工具 指定路由解析 先看一下本机的路由信息 root gt route Kernel IP routing table Destination Gateway Genmask Flags Metric R
  • kafka后台启动命令

    命令 sh kafka server start sh config server properties 目的是想让服务后台启动 符号代表后台启动 运行命令后服务确实后台启动了 但日志会打印在控制台 而且关掉命令行窗口 服务就会随之停止 这
  • 万物分割SAM使用教程

    文章目录 安装 使用 全图分割 点 框 完整代码 原理篇 安装 创建虚拟环境 conda create n sam python 3 8 激活环境 conda activate sam 下载代码 git clone git github c
  • Python利用zipfile生成linux压缩目录穿越文件

    import zipfile if name main try binary 111 zipFile zipfile ZipFile test2 zip a zipfile ZIP DEFLATED info zipfile ZipInfo
  • 自建网站:免费图床不好用,云存储担心被攻击

    刚刚在看公众号文章的时候 无意中刷到了两个关于图片存储的文章 一个说的是网站被盗刷了1 7T流量 另一个说的是将网站图床换到了阿里云OSS 然后结合到前段时间小编遇到的一些关于网站图床的问题 小编就想到了很多自建网站其实都面临着图片等静态文
  • 【嵌入式】基于FATFS/Littlefs文件系统的日志框架实现

    嵌入式 基于FATFS Littlefs文件系统的日志框架实现 文章目录 嵌入式 基于FATFS Littlefs文件系统的日志框架实现 1 概述 2 设计概要 3 设计实现 3 1 初始化 init 3 2 日志写入 write 3 3
  • VMware Workstation 11 安装教程

    哈喽 大家好 今天一起学习的是VMware Workstation 11的安装 vm虚拟机是小编非常喜欢的生产力软件 小编之前发布的测试教程钧在vm上进行的实验 VMware Workstation是一款功能强大的桌面虚拟计算机软件 它能够
  • 进入geth交互平台的命令大全解释

    这里有很多进入geth平台的命令参数来确保你的链是私链 nodiscover 不被其他节点发现 但是如果有相同创世块和networkid的节点可以连接进私链 nodiscover Use this to make sure that you
  • k8s集群搭建(二进制方式)

    k8s集群搭建 二进制方式 1 安装要求 2 准备环境 3 操作系统初始化配置 4 部署 Etcd 集群 4 1 准备 cfssl 证书生成工具 4 2 生成 Etcd 证书 4 3 从 Github 下载二进制文件 4 4 部署 Etcd
  • 编码套路的实战演练

    1 写一份自己的简历 把自己所有的相关技能都罗列出来 然后把那些在100年后还用得到的标出来 给每个技能打分 满分为10分 2 罗列出你所景仰的程序员 尽量包括那些与你一起工作的人 因为你会在工作中从他们身上获取一些技能 记录下他们身上的1
  • 干货

    源于频率主义学派的极大似然估计 Maximum Likelihood Estimation 简称MLE 是根据数据采样来估计概率分布参数的经典方法 在机器学习的对数几率回归 贝叶斯分类器等中有广泛的应用 1 极大似然估计法 设总体的概率密度