使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

2024-02-12

我已经实施了贝叶斯概率矩阵分解 https://www.cs.toronto.edu/~amnih/papers/bpmf.pdf算法使用pymc3在Python中。我还实现了它的前身，概率矩阵分解（PMF）。看我之前的问题 https://stats.stackexchange.com/questions/146547/pymc3-implementation-of-probabilistic-matrix-factorization-pmf-map-produces-a以供参考此处使用的数据。

我在使用 NUTS 采样器绘制 MCMC 样本时遇到问题。我使用 PMF 中的 MAP 初始化模型参数，并使用高斯随机绘制的超参数在 0 附近进行初始化。但是，我得到了PositiveDefiniteError为采样器设置步骤对象时。我已经验证 PMF 的 MAP 估计是合理的，因此我预计它与超参数的初始化方式有关。 PMF 模型如下：

import pymc3 as pm
import numpy as np
import pandas as pd
import theano
import scipy as sp

data = pd.read_csv('jester-dense-subset-100x20.csv')    
n, m = data.shape
test_size = m / 10
train_size = m - test_size

train = data.copy()
train.ix[:,train_size:] = np.nan  # remove test set data
train[train.isnull()] = train.mean().mean()  # mean value imputation
train = train.values

test = data.copy()
test.ix[:,:train_size] = np.nan  # remove train set data
test = test.values    

# Low precision reflects uncertainty; prevents overfitting
alpha_u = alpha_v = 1/np.var(train)
alpha = np.ones((n,m)) * 2  # fixed precision for likelihood function
dim = 10  # dimensionality

# Specify the model.
with pm.Model() as pmf:
    pmf_U = pm.MvNormal('U', mu=0, tau=alpha_u * np.eye(dim),
                        shape=(n, dim), testval=np.random.randn(n, dim)*.01)
    pmf_V = pm.MvNormal('V', mu=0, tau=alpha_v * np.eye(dim),
                        shape=(m, dim), testval=np.random.randn(m, dim)*.01)
    pmf_R = pm.Normal('R', mu=theano.tensor.dot(pmf_U, pmf_V.T),
                      tau=alpha, observed=train)

    # Find mode of posterior using optimization
    start = pm.find_MAP(fmin=sp.optimize.fmin_powell)

这是 BPMF：

n, m = data.shape
dim = 10  # dimensionality
beta_0 = 1  # scaling factor for lambdas; unclear on its use
alpha = np.ones((n,m)) * 2  # fixed precision for likelihood function

logging.info('building the BPMF model')
std = .05  # how much noise to use for model initialization
with pm.Model() as bpmf:
    # Specify user feature matrix
    lambda_u = pm.Wishart(
        'lambda_u', n=dim, V=np.eye(dim), shape=(dim, dim),
        testval=np.random.randn(dim, dim) * std)
    mu_u = pm.Normal(
        'mu_u', mu=0, tau=beta_0 * lambda_u, shape=dim,
        testval=np.random.randn(dim) * std)
    U = pm.MvNormal(
        'U', mu=mu_u, tau=lambda_u, shape=(n, dim),
        testval=np.random.randn(n, dim) * std)

    # Specify item feature matrix
    lambda_v = pm.Wishart(
        'lambda_v', n=dim, V=np.eye(dim), shape=(dim, dim),
        testval=np.random.randn(dim, dim) * std)
    mu_v = pm.Normal(
        'mu_v', mu=0, tau=beta_0 * lambda_v, shape=dim,
         testval=np.random.randn(dim) * std)
    V = pm.MvNormal(
        'V', mu=mu_v, tau=lambda_v, shape=(m, dim),
        testval=np.random.randn(m, dim) * std)

    # Specify rating likelihood function
    R = pm.Normal(
        'R', mu=theano.tensor.dot(U, V.T), tau=alpha,
        observed=train)

# `start` is the start dictionary obtained from running find_MAP for PMF.
for key in bpmf.test_point:
    if key not in start:
        start[key] = bpmf.test_point[key]

with bpmf:
    step = pm.NUTS(scaling=start)

在最后一行，我收到以下错误：

PositiveDefiniteError: Scaling is not positive definite. Simple check failed. Diagonal contains negatives. Check indexes [   0    2   ...  2206  2207  ]

据我了解，我不能使用find_MAP使用具有超先验（如 BPMF）的模型。这就是为什么我尝试使用 PMF 中的 MAP 值进行初始化，PMF 使用 U 和 V 上参数的点估计，而不是参数化的超先验。

不幸的是，Wishart 发行版无法正常运行。我最近在这里添加了一个警告：https://github.com/pymc-devs/pymc3/commit/642f63973ec9f807fb6e55a0fc4b31bdfa1f261e https://github.com/pymc-devs/pymc3/commit/642f63973ec9f807fb6e55a0fc4b31bdfa1f261e

有关此棘手发行版的更多讨论，请参见此处：https://github.com/pymc-devs/pymc3/issues/538 https://github.com/pymc-devs/pymc3/issues/538

您可以通过修复协方差矩阵来确认这就是源。如果是这样的话，我会尝试使用 JKL 先验分布：https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/LKJ_correlation.py https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/LKJ_correlation.py

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError 的相关文章

Bayesian Neural Network Recent Papers-贝叶斯神经网络相关研究文章

Bayesian Neural Network Recent Papers 贝叶斯神经网络相关研究文章 MethodsVariational Inference VI Markov Chain Monte CarloMCMC 43 VIEn
多维时序

多维时序 MATLAB实现基于贝叶斯线性回归 Bayesian Regression 的多变量输入回归预测目录多维时序 MATLAB实现基于贝叶斯线性回归 Bayesian Regression 的多变量输入回归预测预测效果基本介绍
在 pytorch 上使用 MC Dropout 测量不确定性

我正在尝试在 Pytorch 上使用 Mc Dropout 实现贝叶斯 CNN 主要思想是通过在测试时应用 dropout 并运行多次前向传递您可以从各种不同的模型中获得预测我发现了 Mc Dropout 的应用但我真的不明白他们是
pymc3：多个观察值

我有一些观测数据想要估计参数我认为这将是尝试 PYMC3 的好机会我的数据由一系列记录构成每条记录包含一对与固定的一小时时间段相关的观察结果一项观察是给定一小时内发生的事件总数另一个观察结果是该时间段内的成功数量例如一个数据点
使用 ggplot() 和 bsts() 包通过 MCMC 进行贝叶斯时间序列分析生成 BSTS 平均绝对百分比误差 (MAPE) 图

Problem 我有一个名为 FID 的数据框见下文其中包含年和月两列以及 Sighting Frequency 鸟类计数数据框包含3 years之间的观察值2015 2017 表示我有 36 个月的数据我已经运行了使用 M
PyMC3 Dirichlet 过程多元高斯混合模型

我无法让我的形状适用于狄利克雷过程高斯混合模型我的数据observations有形状 number of samples number of dimensions 每个高斯均值应从各向同性先验中得出每个高斯协方差应为单位矩阵我以为我设
在 PyMC3 中使用复数似然

pymc version 3 0 theano version 0 6 0 dev RELEASE 我正在尝试将 PyMC3 与复杂的似然函数一起使用第一个问题这可能吗这是我尝试使用托马斯维茨基的帖子作为指导 import nump
如何使用 rstanarm 以 APA 风格报告贝叶斯线性（混合）模型？

我目前正在努力解决如何按照 APA 6 建议报告输出的问题rstanarm stan lmer 首先我将在频率论方法中拟合混合模型然后尝试使用贝叶斯框架执行相同的操作这是获取数据的可重现代码 library tidyverse lib
如何使用 pymc 制作离散状态马尔可夫模型？

我试图找出如何正确制作离散状态马尔可夫链模型pymc http pymc devs github io pymc index html 举个例子查看nbviewer http nbviewer ipython org github shp
PyMC3 中的简单动态模型

我正在尝试在 PyMC3 中构建一个动态系统模型以推断两个参数该模型是流行病学中常用的基本SIR dS dt r0 g S I dI dt g I r S 1 其中 r0 和 g 是要推断的参数到目前为止我根本无法走得太远我见过的
在 Python 中加速 Metropolis-Hastings 算法

我有一些使用 MCMC 对后验分布进行采样的代码特别是黑斯廷斯大都会 https en wikipedia org wiki Metropolis E2 80 93Hastings algorithm 我使用 scipy 生成随机样本 i
如何使用pymc参数化概率图模型？

如何使用 pymc 参数化概率图形模型假设我有一个带有两个节点的 PGMX and Y 可以说X gt Y是图表 And X有两个值 0 1 and Y也有两个值 0 1 我想使用 pymc 来学习分布的参数并填充用于运行推理的图形模型
为 Twitter 情绪分析项目寻找 C# 中的开源朴素贝叶斯分类器 [已关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
PyMC - 方差-协方差矩阵估计

我读了下面的论文 http www3 stat sinica edu tw statistica oldpdf A10n416 pdf http www3 stat sinica edu tw statistica oldpdf A10n4
pymc3 具有来自核密度估计的自定义似然函数

我正在尝试将 pymc3 与从一些观察数据派生的似然函数一起使用这些观察到的数据不符合任何好的标准分布所以我想根据这些观察来定义我自己的数据一种方法是对观测值使用核密度估计这在 pymc2 中是可能的但与 pymc3 中的 The
聚类和贝叶斯分类器 Matlab

因此我正处于下一步该做什么的十字路口我开始学习一些机器学习算法并将其应用于复杂的数据集现在我已经做到了我从一开始的计划就是结合两种可能的分类器试图建立一个多分类系统但这就是我被困住的地方我选择聚类算法模糊 C 均值在学习了
使用GpyOpt时如何添加限制条件？

目前我尝试使用 GPyOpt 最小化函数并获得优化的参数 import GPy import GPyOpt from math import log def f x x0 x1 x2 x3 x4 x5 x 0 x 1 x 2 x 3 x 4
如何使用 logit 函数编写 JAGS 二项式模型文件

我正在做一项作业使用 JAGS 对二项式分布进行建模p参数是另一个变量的函数d 这就是我正在尝试做的为两个参数 alpha beta 从后验生成 10000 个样本当 dist 25 进行 100 次尝试时根据后验预测成功次数生成样
在 R 中编写多重积分函数

为了将以下内容转换为函数我想知道如何用 R 代码编写以下二重积分 bar x mu 假设pi0 and pi1以向量化方式实现函数 pi 0 和 pi 1 可能的解决方案是 integral lt function n mu s pi0
使用带有高斯先验的主持人

我试图在使用 emcee 之前使用高斯但似乎无法完全弄清楚基本上我想更换 def lnprior theta a b c theta if 1 0 lt a lt 2 0 and 1 0 lt b lt 2 0 and 1 0 lt c

随机推荐

有没有办法使用http将打印任务发送到支持IPP的网络打印机？

我正在开发一个 Android 打印服务应用程序该应用程序应该允许用户执行以下操作浏览手机的内部存储并将所选文件发送到支持 IPP 的打印机进行打印这几天上网查了一下只找到一个解决办法如何在android中使用ipp 互联网打印协
Firefox 网络面板中的彩色条代表什么？

在 Firefox 开发者工具中在 Net 面板下加载的资源的加载时间分为不同的颜色类别这些都是 DNS查询连接中 Blocking Sending Waiting 接收其中每一个代表什么更具体地说它们中的任何一个是否准确地
通过 cython 将 python 字符串传递给 C

我正在尝试编写一个包含一些 c 和一些 python 部分的模块我正在使用 cython 来弥补差距我想在 python 中存储我的很长的字符串常量因为它有更好的语法 const char long string npart of
识别常见的周期波形（方波、正弦波、锯齿波……）

如果没有任何用户交互程序如何识别 ADC 记录中存在什么类型的波形对于这个问题恒定频率的三角波方波正弦波半正弦波或锯齿波电平和频率是任意的并且它们会有噪声少量失真和其他缺陷我也会提出一些天真的想法你可以投票赞成或反
使用 IIFE 时使用 CommonController 实例化其他 AngularJS 控制器

我有一个项目其中许多模型将由几乎相同的控制器代码管理唯一的例外是它们调用不同的服务我现在处理这个问题的方法是使用通用代码实例化一个 Crud Controller 到每个自定义控制器中然后通过更改自定义控制器内的变量来重定向服务调用
使用S3 for Rails“公共/图像”是否很好，并且有一种简单的方法可以做到这一点？

我对 S3 有点陌生我想知道将公共图像放入 S3 存储桶中是否是一个好主意如果是是否有一种简单的方法可以进行移动如果您查看 config environments production rb 您将看到以下代码行已注释掉 conf
如何在 iPhone 的“文件”应用程序中显示我的应用程序文档

我正在尝试在 iPhone 上的文件应用中显示我的应用中的数据查了很多资料都对就是不知道错在哪里 func fileManger nameFolder String let manager FileManager default
为什么 Python 的 `re.split()` 不在零长度匹配上进行分割？

一个特别的怪癖否则相当强大 rePython中的模块是re split 永远不会在零长度匹配上分割字符串 http docs python org library re html re split 例如如果我想沿单词边界分割字符串 gt
导入时出现玩笑错误：意外的令牌导入

我见过类似的问题但仍然找不到可行的解决方案我正在尝试将 Jest 集成到一个工作项目中该项目在数百个地方使用导入导出默认值以下测试确实适用于使用 require 的 Jest const bar require flows foo
谷歌地图覆盖层

我试图在我的谷歌地图上放一个图层来覆盖它不必与谷歌地图进行任何交互它只是一层在另一层之上我现在有什么 div div div div 在地图 div 中我放置了谷歌地图覆盖层的背景与地图 div 一样大但谷歌地图始终将自己放在顶
在 Emacs Lisp 中插入整月的日期

我正在 Emacs Lisp 中进行一些编程但我不完全确定如何处理某些事情我正在尝试插入一整月的日期每个日期都在一个新行上如下列表所示 January 2009 年 1 月 1 日星期一 02 01 09 星期二 03 01 09
如何在 Android Studio 3.0.0 中使用数据绑定和 Kotlin

我刚刚开始使用 Android Studio 3 0 0 但每次尝试构建项目时都会收到此错误 Error Circular dependency between the following tasks app compileDebugKot
Eclipse - 可执行 jar 文件错误

当我使用 eclipse 功能导出可执行 jar 等时当它制作罐子时我收到一条消息 JAR 导出已完成但有警告查看具体信息详细信息无法读取 JAR 文件 classpath 原因打开 zip 文件时出错我不知道这意味着什么以
无法在 pandas 数据框中按时间戳建立索引

我拿了一张 Excel 工作表其中包含日期和一些值并希望将它们转换为 pandas 数据框并仅选择特定日期之间的行由于某种原因我无法按日期索引选择行 Excel 文件中的原始数据 MCU Timestamp 50D 10P1 10
是否可以在 Android 中以编程方式卸载软件包

软件包可以自行卸载吗如果一个包共享相同的 userId 和签名可以卸载另一个包吗 Uri packageURI Uri parse package your packagename here Intent uninstallIntent
在 C/C++ 中， char* arrayName[][] 是指向指针的指针还是指向指针的指针？

我将多维数组理解为指向指针的指针但也许我错了例如我认为 char var char var char var char var or char var char var char var or char var or char var
如何使动态数量的 div 均匀地占据其容器中的所有空间？

我有一个容器其中有动态数量的 div 我希望所有的 div 都适合在一行上而不换行以便每个 div 具有相同的宽度 div 的数量和屏幕的大小都可以改变我希望有一个CSS解决方案 In 这把小提琴 http jsfiddle net
Workflow Foundation 4.5“表达式活动类型‘CSharpValue`1’需要编译才能运行。”

我正在通过入门教程 http msdn microsoft com en us library dd489454 aspx对于 WF45 我遇到了一个看起来其他人也遇到过的问题但与我遇到的方式不同我希望其他人能为我找到解决方案当我完成
如何在 F# 中实现异步而不是并行

坚持使用异步获取许多网页的常见示例我如何异步分拆多个数百个网页请求然后等待所有请求完成然后再进行下一步 Async AsParallel 一次处理几个请求由 CPU 上的核心数量控制抓取网页不是 CPU 密集型操作我对 As
使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

我已经实施了贝叶斯概率矩阵分解 https www cs toronto edu amnih papers bpmf pdf算法使用pymc3在Python中我还实现了它的前身概率矩阵分解 PMF 看我之前的问题 https stats

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError 的相关文章

随机推荐

热门标签