LDA学习笔记3-抽样算法

2023-05-16

抽样的基本问题是，对于给定目标概率p（x），如何抽取一组满足该分布的变量。在某些问题中可能还有别的约束条件，如iid等。

基本的抽样算法有

1.基本方法

基本思路通过函数变换将一个均匀分布转化为目标分布，缺点是，对函数性质有一定要求，性质较差的可能没有解析解或无法求解。

具体方法是，设原pdf为p（x），其对应的分布函数F（x）。设y=F（x），当y服从0~1的均匀分布，则反函数求x即满足对应pdf

几何说明如下图

2.rejection sampling

这个算法需要先找到一个能够抽样的参照分布（proposal distribution）q（x），使得p(x)<=M*q(x)对任意的x成立，其中M是一个常数

接下来，对q(x)进行抽样，按照均匀分布拒绝掉其中的某些点，剩余的点即满足分布p。

具体算法为

其几何解释为

p(x)和q(x)的积分都为1，按照上述算法，满足q（x）的抽样点，只有1/M能被接受。所以，我们希望p和q形状能尽可能的接近，M尽可能小，以获得更好的采样效率。

但是在高维的情况下，这个接受率按照指数降低。这个缺点使得rejection方法很难实际应用于高维抽样的情况。

3.importance sampling(重要性抽样？)

和以上两种方法不同，重要性抽样并不生成符合目标概率p的抽样点，而是通过对满足一个参照分布q的样本点进行加权，获得对应p分布的某个函数f的数学期望

如上式，z为符合参考分布q的抽样点，对z的操作可以近似获得d（z）dz的积分，p(z)/q(z) 称为importance weights，加权后，d(z)dz的积分变换为对p(z)dz的积分。

在实际应用中，为了方便起见，经常把q（x）取为对应区间的均匀分布。

实际应用中，p,q可能未经过归一化，也可以把归一化的步骤放到权重中，则zl对应的归一化后的权重wl为

跟rejection sampling一样，importance sampling也希望参照分布q和p能尽量接近。否则，若p集中在某个区间，而q在这个区间概率很低，也就是说，极少数落在该区间的样本点很少将在很大程度上决定了上述的E（f），这样获得的结果跟真实值差异可能很大。

在Bayes网络中，设联合分布为p（Z1，Z2），其中Z1为未知变量，Z2为观察值。

3.1 likelihood weighted sampling

如果直接使用importance sampling的方法，取q(Z1,Z2)为对应区间上的均匀分布,然后丢弃掉其中和观察值不匹配的采样点，仅留下Z2=z2的样本点，利用这些点,加权p(Z)/c计算期望(c为均匀分布对应的均值)。当z的定义域很大时，可能导致抽样接受率很低。

为了解决这个问题，有人提出了一种改进：likelihood weighted sampling。这种方法，根据Bayes Net中的依赖关系依次抽取每个变量。当变量为观察值，直接设为观察值，否则，按条件概率p（Zi|pai）抽取Zi。则对应权重p（x）/q(x) =

3.2 sampling-importance-resampling(SIR)

importance sampling只能计算对应的期望值，本身无法生成满足p的样本点。SIR算法则是在importance sampling结果上进行加工，生成满足p的样本点，以弥补这个缺陷

算法分两步

1.按照IS方式生成满足分布q的L个样本点z1， z2， .....,zL，以及对应的权重wl ，有/sum wi =1

2.按照概率分布（w1,w2,...wL）取出对应的z1，...zL. 这个步骤应该这样理解：Z只能取值z1，z2...,ZL有限个离散值，其中P（Z=zi）=wi

参考文献：

PRML:11章

An Introduction to MCMC for Machine Learning，ANDRIEU等

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LDA学习笔记3-抽样算法的相关文章

Shell 脚本详解

简介 shell xff1a 蛋壳 shell脚本是在操作系统外 xff0c 可以直接调用系统内核命令的一个脚本语言 shell脚本可以分为两大类组成 xff1a 1 命令行 xff08 系统命令行 xff09 2 脚本语法 xff08
Windows——电脑不能连接手机热点(WLAN显示已经禁用)的解决办法

笔记本电脑提示 xff1a 已关闭无线功能基于这篇博客之上 xff0c 在第二步中 xff0c 关闭WLAN AutoConfig 服务 xff0c 之后重新打开WLAN AutoConfig 服务 xff0c 即可
Ubuntu——系统语言由英文切换到中文的方法

一方法一 ubuntu设置系统语言为中文二方法二若方法一中不能拖动中文输入法到第一行 xff0c 则可以直接采取卸载英文输入法 xff0c 这样就中文输入法到第一行了 xff0c 切换成中文了英文输入法可以根据需要考虑是否安装一
RealSense D435——基本介绍

一结构介绍采用的是结构光Tof成像方案正面的四个摄像头从左至右 xff0c 依次是左红外相机红外点阵投影仪右红外相机 RGB相机 xff08 前三个负责形成深度图 xff0c 最后一个就形成RGB图 xff09 二小贴士 RGB
RealSense D435——相机内参获取

RealSense D435 相机内参获取一参考博客二小贴士2 1 遇到的问题及解决方案问题一描述问题一解决方法问题二描述问题二解决方法一参考博客 RealSense D435内参获取环境配置 xff1a Realsense D4
Vscode——报错解决：Unable to start debugging.Unexpected GDB output from command. 或程序点击运行一直无结果

一报错截图 1 Unable to start debugging Unexpected GDB output from command 2 程序点击运行一直无结果二原因路径中含有中文三解决办法将文件放入不包含中文的路径下
Github——合并分支

一当两个分支不一样时 xff0c 会出现下面的标志 xff08 前提是设定了分支保护 xff09 xff0c 点击Compare amp pull request 二选择双方分支三处理请求四确认请求
基于四旋翼飞行器的陀螺仪、加速度计、磁力计传感器说明

一什么是磁力计加速度计和陀螺仪以及他们之间的区别 1 什么是陀螺仪加速度计和磁力计 xff1f xff08 1 xff09 陀螺仪 xff08 Gyroscope GYRO Sensor xff09 也叫地感器 xff0c 三轴陀螺仪
操作系统（二） -- 操作系统的接口与实现

前言操作系统的接口什么是操作系统的接口POSIX标准系统调用的实现 1 xff0c 用户程序能不能直接调用系统内核2 xff0c 如果不能直接调用 xff0c 为什么 xff1f 如何实现的3 xff0c 用户程序如何才能调用系统内核系
自动驾驶路径规划技术-高速公路路径规划

Path Planning Highway Driving project Github https github com williamhyin CarND Path Planning Email williamhyin 64 outlo
FYI, MySQL高效分页

在Percona Performance Conference 2009大会上来自yahoo的Surat Singh Bhati surat 64 yahoo inc com 和 Rick James rjames 64 yahoo inc
【论文理解】ArcFace: Additive Angular Margin Loss for Deep Face Recognition（InsightFace）

论文地址 xff1a https arxiv org abs 1801 07698 github xff1a https github com deepinsight insightface 这篇论文基本介绍了近期较为流行的人脸识别模型 x
Ubuntu录屏

1 CTRL 43 ALT 43 SHIFT 43 R 开始录屏 2 CTRL 43 ALT 43 SHIFT 43 R 结束录屏 3 视频保持路径 xff1a Video xxx webm 注意 xff1a 默认录屏时间为30秒 xff0
make的命令行选项

http www linuxsir org main doc gnumake GNUmake v3 80 zh CN html make 09 html 这些参数可以通过man手册查看红色是比较有用的选项 b m 忽略 xff0c 提供其
泛化,实现,依赖,关联(聚合,组合)

UML 中类与类类与接口接口与接口这间的关系有泛化 generalization 关系关联 association 关系关联聚合合成依赖 dependency 关系 xff0c 实现 realization 关系目录泛化
C语言中的结束符‘\0‘

C语言中的结束符 0 39 0 是C语言中的字符串结束标志它的十进制输出 xff1a 0 xff0c 字符型输出 xff1a 空字符 xff08 什么都没有 xff0c 空空如也 xff09 xff08 C语言中字符串是用英文输入法的双引
FreeRTOS新建任务不执行问题解决办法

原因 FreeRTOS的堆栈太小解决办法增大堆栈修改configTOTAL HEAP SIZE这个配置参数为48k 49152 一般默认为15k 15360 span class token macro property span c
ROC与AUC最通俗的解释，准确率，错误率精准率召回率，ROC，AUC 的区别和联系

前言本文内容大部分来自于如下两个博客 xff1a http blog csdn net dinosoft article details 43114935 http my oschina net liangtee blog 340317
AUC与准确率关系。AUC越大，准确率就越高？【优先考虑AUC】

问题近日 xff0c 一位朋友拿着两个模型预测效果比较的结果来咨询 xff0c 当然是遇到了一个好像不太正常的现象才来咨询的两个模型都是二分类结局的 xff0c 应用常见的Logistic回归模型得到结果如下 xff1a 模型A的正确率
论文投稿基金名称标准版中英文

来自知名期刊官网 xff1a 国家自然科学基金 National Natural Science Foundation of China 航空科学基金 Aeronautical Science Foundation of China 国家

随机推荐

ROC曲线绘制与计算

假设现在有一个二分类问题 xff0c 先引入两个概念 xff1a 真正例率 xff08 TPR xff09 xff1a 正例中预测为正例的比例假正例率 xff08 FPR xff09 xff1a 反例中预测为正例的比例再假设样本数为6 x
9 行代码提高少样本学习泛化能力【迁移基对小数据集进行校准calibration】

本文介绍一篇最新发表在ICLR2021 Oral上的少样本学习工作 xff0c 他们尝试从数据分布估计的角度去缓解少样本学习中的过拟合现象 xff0c 并提出通过分布矫正 xff08 估计 xff09 的方式弥合这种差距链接 xff1a
Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

这是CVPR2018 Oral的一篇关于 Image Captioning和Visual Question Answering的文章 xff0c paper链接https arxiv org abs 1707 07998 xff0c 作者的
实现细粒度图像识别 Bilinear CNN Keras实现

细粒度视觉识别之双线性CNN模型 1 Lin T Y RoyChowdhury A Maji S Bilinear cnn models for fine grained visual recognition C Proceedings o
损失函数(Loss function)、代价函数(成本函数)(Cost function)、目标函数(objective function)的区别与联系

基本概念 xff1a 损失函数 Loss function xff1a 计算的是一个样本的误差损失函数是定义在单个训练样本上的 xff0c 也就是就算一个样本的误差 xff0c 比如我们想要分类 xff0c 就是预测的类别和实际类别的区别
【patch】CNN中 patch 是什么？patch 在CNN学习训练中是怎么起作用的？

在阅读基于深度卷积神经网络的图像识别分类或检测的文献时经常看到 patch xff0c 不是很能理解 xff0c 后来就总结了一下通过阅读 xff0c patch 似乎是CNN输入图像的其中一小块 xff0c 但它究竟是什么呢当使用C
MIT四足机器狗MPC算法学习笔记

暑假去机器人相关单位实习 xff0c 学习运动控制相关内容现学现卖 xff0c 磨出了一篇学习笔记由于非相关专业 xff0c 估计会有不少错误 xff0c 欢迎批评指正 xff01
PySide2、nltk、wordcloud、gensim、sklearn、pyinstaller实现词嵌入可视化、绘制词云图、制作GUI并打包的踩坑总结

最近有个英语词汇学的期末作业 xff0c 老师说可以写论文也可以写一个小程序作为一个学物理的兔子 xff0c 当然选择写程序啦 xff08 误 xff09 不过其中遇到了不少坑 xff0c 就来总结一下首先说一下这个程序的设计思路其实
树莓派ssh启动踩坑总结

0 前情提要四年前的树莓派 xff0c 好久没用了 xff0c 最近在学网络 xff0c 就想着用树莓派做几个小实验由于四年前用的是hdmi外接显示屏的方案 xff0c 还需要额外配备键鼠 xff0c 感觉颇为不便 xff0c 就想着用
实验六 MapReduce实验：二次排序

实验指导 xff1a 6 1 实验目的基于MapReduce思想 xff0c 编写SecondarySort程序 6 2 实验要求要能理解MapReduce编程思想 xff0c 会编写MapReduce版本二次排序程序 xff0c 然后
Rviz显示理想的运动的轨迹，并对比实时的运动轨迹

20210505更新前天的bug xff0c 修改了marker点的尺寸和颜色后在rviz中不显示的问题解决了 xff0c 代码什么的完全没有改 xff0c 只是用了sudo apt get upgrade xff0c 把ros的一些包和
编译报错 CMake Error: The following variables are used in this project, but they are set to NOTFOUND.

1 Problem 用一块新的Nvidia的 Jetson NX板编译时遇到一个报错 xff0c 如下 xff1a CMake Error The following variables are used in this project b
使用gazebo中的building editor创建一个建筑环境并用于仿真

说明 xff1a 此文仅针对Learning ROS for Robotics Programming Second Edition这本书中的第八章的内容一使用gazebo创建建筑 1 打开building editor xff08 1
Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

CVPR2018一篇关于Visual Question Answering Tricks的文章 xff0c 作者是2017 VQA Challenge冠军团队成员之一 xff0c paper连接https arxiv org abs 170
Openwrt中MT7628/MT7688的全部GPIO复用配置及常用接口DTS配置总结

Openwrt的不同版本中关于MT7628 xff0c MT7688的GPIO配置 xff0c 存在或多或少的一些小问题下面将以MT7628AN为基础 xff0c 介绍其全部的GPIO功能复用配置 xff0c 以及需要注意的地方 MT76
串口通讯原理

串口是计算机上一种非常通用设备通信的协议 xff08 不要与通用串行总线Universal Serial Bus或者USB混淆 xff09 大多数计算机包含两个基于RS232的串口串口同时也是仪器仪表设备通用的通信协议 xff1b 很多G
车载VSLAM与激光雷达方案

基于VSALM在计算机视觉领域的领先技术 xff0c 提供优异的视觉目标检测功能提供前视视觉感知 xff0c 环视视觉感知以及APA系统的一站式ADAS功能解决方案基于激光与视觉检测的融合结果 xff0c 覆盖更为广泛的应用场合从特征
STL容器的适用情况和缺点

61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61
win7与深度(Deepin)linux 双系统启动顺序调整

一台win7电脑 xff0c 安装deepin系统后 xff0c 默认启动是系统是Deepin 电脑开机后进入启动页面前2项为Deepin的启动引导 xff0c 第3项是Win7的启动引导每次启动想进入Win7都需要手动选择 xff0c
LDA学习笔记3-抽样算法

抽样的基本问题是 xff0c 对于给定目标概率p xff08 x xff09 xff0c 如何抽取一组满足该分布的变量在某些问题中可能还有别的约束条件 xff0c 如iid等基本的抽样算法有 1 基本方法基本思路通过函数变换将一个均匀

LDA学习笔记3-抽样算法

LDA学习笔记3-抽样算法 的相关文章

随机推荐

热门标签

LDA学习笔记3-抽样算法的相关文章