【机器学习】Tensorflow概率编程：线性混合模型

2023-11-08

　　线性模型是我们最常见到的、最理想的数学模型，基本的线性模型是数据科学入门的基本案例。然而现实生活中的线性问题，很大几率不适用于基本的线性模型，需要使用线性混合模型来描述。Tensorflow edward提供对这类问题的解决方案。
　　大部分数据科学教材头几章都会讲解线性回归等知识。这些方法基于简单的线性模型，有一些强假设，比如：只有目标特征会影响样本；目标特征彼此独立等。然而现实问题并不一定符合这样理想化的假设。譬如说，某类网站点击量会随着一年不同季节的变化而出现一定差异；调查某类人群的心理状况，单个人调查多次，可能出现不同的结果。显然，这些样本由一些主要的、明显独立的主要特征来决定，但又受到一些其他特征的干扰，这些特征可能彼此都不独立，也可能无法量化（比如人员ID）。这些可能需要使用更加复杂的模型来描述。
　　线性混合模型要解决的问题，是计算主要特征（固定特征\效应）与样本的关系，同时考虑一些次要特征（随机特征\效应）的影响。如果我们只计算固定特征，那么表明我们默认结果只和固定特征、目标样本有关，所做的计算完全去迎合我们的样本，这是一个非常强的假设，能否适用于其他样本其他情况，这个不予以考虑；如果我们补充考虑一些其他次要特征带来的影响，那么整个模型弹性度就上升，能适用于更广的范围，同时这也使得固定特征的解空间的范围变小，即解更加明确。那么观测上述作用，我们注意到这这些作用与某个概念的作用非常相似——正则化。
　　我们来看看线性混合模型的结构。线性模式的通用形式是 Y=WX+B ，为了对应Edward官网教程，也可写成 Y=Xβ ，统一了斜率项和截距项。而线性混合模型同时考虑了固定特征和随机特征。设随机特征为 Z ，那么写成Y=WX+Bf+Zη+Br，后两项是随机特征；亦可写成 Y=Xβ+Zη,η∼N(0,σ2) ，对 η 的限定是为了控制随机项对结果的影响。一些教材中往往写成 Y=Xβ+Zη+ϵ ，其中 ϵ 指的是误差项。随机特征的考虑是比较复杂的，有相关性算法用于判别；工程上则比较考验工程师的经验，用经验判断往往有很好的效果。
那么Tensorflow Edward怎么实现线性混合模型呢？我们来看看官网给出的例子。
　　首先我们需要一块数据，这块数据叫InstEval，下载地址为https://github.com/blei-lab/edward/blob/master/examples/data/insteval.csv。这是一个关于教师教学与学生成绩的关系列表。数据里面 Y 对应的项就是y，即成绩等级/分数，s对应学生ID，dept对应部门ID，d对应教师ID，service表示是否进行教学，是一个二值项。我们将service设为固定特征。ID只是作为样本的序号来使用，与我们明显是不能作为特征输入的；我们知道不同的教师、部门等会产生影响，但是不明白不同部门、教师等具体有什么样的影响与关系，这些作为随机特征。为了考虑不同教师、部门的影响，ID必须经过数据预处理，变为category数据才能使用，即

data = pd.read_csv('../examples/data/insteval.csv')
data['dcodes'] = data['d'].astype('category').cat.codes
data['deptcodes'] = data['dept'].astype('category').cat.codes
data['s'] = data['s'] - 1

这些category项目并不带有真正的特征；我们没有证据认为教师和部门之间具有强的相关性，默认其彼此独立的；我们没有真正意义上的随机特征，因此随机项Zη+Br前面的 Zη 就可以不要了，只保留截距项 Br ，并且令随机项~ N(0,σ2) 。由于信息并不丰富，只能做出上面非常保守的假设。最终我们的线性混合模型表述为：

Y=Serviceβservice+Bf+Bs+Bdept+Bd

根据这个模型，我们就可以利用Tensorflow Edward来建模求解，求解方法是KL变分推断。代码如下：

n_s = 2972  # 学生总数
n_d = 1128  # 老师总数
n_dept = 14  # 部门总数
# 数据输入
s_ph = tf.placeholder(tf.int32, [None])#学生编号category
d_ph = tf.placeholder(tf.int32, [None])#教师编号category
dept_ph = tf.placeholder(tf.int32, [None])#部门编号category
service_ph = tf.placeholder(tf.float32, [None])#二值项，固定特征

#固定特征参数项
mu = tf.Variable(tf.random_normal([]))#Bf
service = tf.Variable(tf.random_normal([]))#beta
#随机特征截距的参数
sigma_s = tf.sqrt(tf.exp(tf.Variable(tf.random_normal([]))))#学生Bs的方差
sigma_d = tf.sqrt(tf.exp(tf.Variable(tf.random_normal([]))))#教师Bd的方差
sigma_dept = tf.sqrt(tf.exp(tf.Variable(tf.random_normal([]))))#部门Bdept方差

# 随机特征截距
eta_s = Normal(loc=tf.zeros(n_s), scale=sigma_s * tf.ones(n_s))
eta_d = Normal(loc=tf.zeros(n_d), scale=sigma_d * tf.ones(n_d))
eta_dept = Normal(loc=tf.zeros(n_dept), scale=sigma_dept * tf.ones(n_dept))
#随机特征项+固定特征项
yhat = tf.gather(eta_s, s_ph) + \
    tf.gather(eta_d, d_ph) + \
    tf.gather(eta_dept, dept_ph) + \
    mu + service * service_ph#这里tf.gather实际作用是样本采样
y = Normal(loc=yhat, scale=tf.ones(n_obs))

这里各个随机特征的截距项是一个服从 N(0,σ2) 的随机变量。然后使用KL变分推断方法进行计算：

q_eta_s = Normal(
    loc=tf.Variable(tf.random_normal([n_s])),
    scale=tf.nn.softplus(tf.Variable(tf.random_normal([n_s]))))
q_eta_d = Normal(
    loc=tf.Variable(tf.random_normal([n_d])),
    scale=tf.nn.softplus(tf.Variable(tf.random_normal([n_d]))))
q_eta_dept = Normal(
    loc=tf.Variable(tf.random_normal([n_dept])),
    scale=tf.nn.softplus(tf.Variable(tf.random_normal([n_dept]))))

latent_vars = {
    eta_s: q_eta_s,
    eta_d: q_eta_d,
    eta_dept: q_eta_dept}
data = {
    y: y_train,
    s_ph: s_train,
    d_ph: d_train,
    dept_ph: dept_train,
    service_ph: service_train}
inference = ed.KLqp(latent_vars, data)

训练数据都是采样好了的，tensorflow对用户自定义采样支持的很好。这里包含另外一个假设，那就是我们认为特征与观测样本的关系可以完全因子分解，用数个多维正态分布的组合能良好的拟合映射关系。
　　为了评估训练的好坏，我们需要计算当前模型的预测结果与实际结果的差值。Tensorflow Edward的语法还不算太完善。比如Edward目前没有原生的用于保存模型、参数的API，需要直接使用Tensorflow的API；Edward单独提供了copy函数，这个API是用于构建预测功能的Edward模块的，请注意python的=号表达式一般是传递引用，因此copy构建的预测模块可以随着训练的进行也同步优化。例如我们要使用训练好的模型来预测新数据：

yhat_test = ed.copy(yhat, {
    eta_s: q_eta_s.mean(),
    eta_d: q_eta_d.mean(),
    eta_dept: q_eta_dept.mean()})
yhat_test.eval(feed_dict={.......})#输入你的数据

一开始我们的参数都是随机的，差值分布非常随意:
这里写图片描述

训练完毕后，差值为0的部分非常集中，差值分布呈现类似正态分布的特点：
这里写图片描述
　　至此，大功告成，考虑进随机项之后，结果依然非常稳定。官网给出了与R语言的结果对比，差异非常小，Edward可以替代部分R的功能。
引用：
http://edwardlib.org/tutorials/linear-mixed-effects-models
Gelman, A., & Hill, J. L. (2006). Data analysis using regression and multilevel/hierarchical models. Cambridge University Press.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【机器学习】Tensorflow概率编程：线性混合模型的相关文章

如何恢复tensorflow inceptions检查点文件（ckpt）？

I have inception resnet v2 2016 08 30 ckpt文件是预先训练的初始模型我想使用恢复这个模型 saver restore sess ckpt filename 但为此我将需要编写训练该模型时使用的变量
如何传递架构以从现有数据帧创建新数据帧？

要将 schema 传递到 json 文件我们这样做 from pyspark sql types import StructField StringType StructType IntegerType data schema Stru
Python - 比较同一字典中的值

我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串该字符串是键的值对于这个例子期望
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

java interface的定义变量_【Java关键字-Interface】为什么Interface中的变量只能是 public static final...

三个关键字在接口中的存在原因 public 接口可以被其他接口继承也可以被类实现类与接口接口与接口可能会形成多层级关系采用public可以满足变量的访问范围 static 如果变量不是static的那么接口必须实例化才可以访问自己
uni.navigateBack 传值

uniapp使用uni navigateBack向上一个页面传值的方式在需要传值的页面写 wx navigateBack 返回 delta 1 uni emit handClick 传递的参数名传递的值获取传过来的值在onShow里面
VC 运行时库 /MD、/MDd 和 /MT、/MTd

VC 运行时库 MD MDd 和 MT MTd 2013 01 24 18 42 11058人阅读评论 2 收藏举报分类 C C 19 有段时间在写cuda程序是出现过 error LNK2005 exit 已经在 MSVCRTD l
微信小程序开发之——CSS动画

一概述上一节介绍了通过CSS属性keyframes设置图片选择动画本文介绍以下两种形式的动画 this animate 接口旧的 wx createAnimation接口新的 2 9 0开始支持二 this animate 2
数据安全之标准-规范-政策-报告集合收藏

下载连接 https note youdao com s Xu9Xu0Gz 20230815更新 DB T DB36 T 1713 2022 公共数据分类分级指南江西 pdf DB31DSJ Z 005 2020 公共数据安全分级指南上
linux系统上insar处理流程,[转载]linux下安装GAMMA软件

1 保持网络连接状态 2 Linux编译环境安装一般安装Linux软件前需要大量的库以及相关GNU软件这样可以避免Linux软件安装或编译出错将yum 代码复制进终端若提示需root权限则先获取root权限如 cz localh
Android 删除文件或文件夹

删除文件或文件夹 fun delFileOrDir file File if file exists return if file isDirectory 递归删除文件夹里的文件 file listFiles forEach delFile
学生成绩管理系统

学生实体属性由学号姓名性别出生日期地区民族组成班级实体属性由班级编码班级名称院系年级人数组成课程实体属性由课程号课程名学分学时学期前置课组成学时实体选择课程实体属于多对多关系学生事宜属于班级实体
Vue中使用vuex(五)

vuex的模块化命名空间 1 目的让代码更好维护让多种数据分类更加明确 2 创建person js import axios from axios import nanoid from nanoid export default na
C# Namespace详解

我现在感到学好C 就是就是要知道C 的基本语法 C 的新的特点 C 能干什么其中我感到不管如何 NAMESPACE都是很关键的可以说不是只对C 而言而是整个 NET都是由NAMESPACE组成的所以我在看了C 的基本语法后就直奔N
Android常用知识点总结

一选择题 1 Android项目中的主题和样式资源通常放在 C 目录 A res drawable B res layout C res values D assets 2 Dalvik虚拟机属于Android系统架构中的 C A 应用
Torchvision.ops.batched_nms() 和 nms()区别

区别 batched nms 根据每个类别进行过滤只对同一种类别进行计算IOU和阈值过滤 nms 不区分类别对所有bbox进行过滤如果有不同类别的bbox重叠的话会导致被过滤掉并不会分开计算 Torchvision ops nms 参数
干货！人体姿态估计与运动预测

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入我们人类具有识别人体姿态预测短期未来的能力例如在走路时我们会识别对向行人的姿态根据对他们未来运动的预测来决定往左走还是往右走在打篮球或踢足球时会根据对防守球员的姿态运动
ASP.NET Core学习路线图

说明 1 先决条件 C https www pluralsight com paths csharp Entity Framework https www pluralsight com search q entity 20framewor
最新的ssm毕业设计题目50例

ssm毕业设计题目1 10题 1 基于SSM的车险管理系统设计与实现 2 基于SSM框架的学子商城系统的设计与实现 3 基于SSM的高校排课系统的研究与应用 4 基于SSM的湖南省入境旅游客源市场结构分析 5 基于SSM模型的重庆制造业主导
VOSviewer安装及配置

VOSviewer安装网址 VOSviewer Download 根据自己电脑安装并且VOSviewer要求JAVA 使用的是1 8 0 https www oracle com technetwork java javase downl
关于maven ＜dependencyManagement＞标签的问题

项目场景我giao 大家好跟大家分享一个使用maven时发现的小问题关于父工程pom文件中 dependencyManagement 标签的问题问题描述在新建夫工程pom文件时在内部的依赖不会马上到中央仓库中去下载jar包而是在
李宏毅-DeepLearning-2017-Unsupervised Learning:Neighbor Embedding

数据降维的方法 Manifold Learning 流行学习 1 什么是流形流形学习的观点认为我们所能观察到的数据实际上是由一个低维流行映射到高维空间的由于数据内部特征的限制一些高维中的数据会产生维度上的冗余实际上这些数据只要比较
将一台笔记本电脑作为另一台笔记本电脑的扩展显示器

步骤步骤1 打开设置可以使用快捷键win i 打开设置然后点击系统步骤2 点击投影到此电脑可以看到右边的选项是灰色不可以选然后点击可选功能如果是可选的可以跳过步骤4 步骤3 查找是否安装了无线显示器如果没有安装
【机器学习】Tensorflow概率编程：线性混合模型

线性模型是我们最常见到的最理想的数学模型基本的线性模型是数据科学入门的基本案例然而现实生活中的线性问题很大几率不适用于基本的线性模型需要使用线性混合模型来描述 Tensorflow edward提供对这类问题的解决方案大部分数据

【机器学习】Tensorflow概率编程：线性混合模型

【机器学习】Tensorflow概率编程：线性混合模型 的相关文章

随机推荐

热门标签

【机器学习】Tensorflow概率编程：线性混合模型的相关文章