使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数

2024-01-07

平方指数或RBF核的基本方程如下：

这里 l 是长度尺度，sigma 是方差参数。长度比例控制两个点的相似程度，因为它只是放大 x 和 x' 之间的距离。方差参数控制函数的平滑程度。

我想用我的训练数据集优化/训练这些参数（l 和 sigma）。我的训练数据集采用以下形式：

X：二维笛卡尔坐标作为输入数据

y：Wi-Fi 设备在二维坐标点处的无线电信号强度 (RSS) 作为观测输出

根据sklearn http://scikit-learn.org/stable/modules/generated/sklearn.gaussian_process.GaussianProcessRegressor.html#sklearn.gaussian_process.GaussianProcessRegressor.get_params，GaussianProcessRegressor 类定义为：

class sklearn.gaussian_process.GaussianProcessRegressor(kernel=None, alpha=1e-10, optimizer=’fmin_l_bfgs_b’, n_restarts_optimizer=0, normalize_y=False, copy_X_train=True, random_state=None)

在这里，optimizer是一个字符串或可使用 L-BFGS-B 算法作为默认优化算法调用（“fmin_l_bfgs_b”). The optimizer可以是内部支持的优化器之一，用于优化内核参数（由字符串指定），也可以是作为可调用传递的外部定义的优化器。此外，scikit-learn 中唯一可用的内部优化器是fmin_l_bfgs_b。然而，我了解到scipy 包 https://docs.scipy.org/doc/scipy/reference/optimize.html有更多的优化器。因为我想用信赖域反射算法 https://docs.scipy.org/doc/scipy-0.17.0/reference/generated/scipy.optimize.least_squares.html#scipy.optimize.least_squares为了优化超参数，我尝试实现如下算法：

def fun_rosenbrock(Xvariable):
    return np.array([10*(Xvariable[1]-Xvariable[0]**2),(1-Xvariable[0])])
Xvariable = [1.0,1.0]
kernel = C(1.0, (1e-5, 1e5)) * RBF(1, (1e-1, 1e3))
trust_region_method = least_squares(fun_rosenbrock,[10,20,30,40,50],bounds=[0,100], method ='trf')

gp = GaussianProcessRegressor(kernel=kernel, optimizer = trust_region_method, alpha =1.2, n_restarts_optimizer=10)
gp.fit(X, y)

由于我无法弄清楚参数“fun”在我的例子中实际上是什么，我求助于使用rosenbrock函数this https://docs.scipy.org/doc/scipy-0.17.0/reference/generated/scipy.optimize.least_squares.html#scipy.optimize.least_squares示例（示例位于页面底部）。我在控制台中收到以下错误。

我的使用方法是scipy 包优化内核参数正确吗？如何打印参数的优化值？参数“fun”是什么scipy.optimize.least_squares https://docs.scipy.org/doc/scipy-0.17.0/reference/generated/scipy.optimize.least_squares.html#scipy.optimize.least_squares就我而言？

谢谢你！

这里存在三个主要问题：

正在优化的目标函数是 Rosenbrock 函数，它是用于优化目的的测试函数。它需要是一个基于内核参数进行优化的成本函数，在 GaussianProcessRegressor 内部，这是对数边际似然，可以作为参数传递给优化器。
对数边际似然优化器内部需要最大化。参见第 1.7.1 节here. http://scikit-learn.org/stable/modules/gaussian_process.html#gaussian-processScipy 最小二乘最小化目标函数，因此您可能需要最小化目标函数的逆函数。
传递到 GaussianProcessRegressor 的优化器的格式，需要以“optimizer”参数下指定的格式传递在文档中。 http://scikit-learn.org/stable/modules/generated/sklearn.gaussian_process.GaussianProcessRegressor.html#sklearn.gaussian_process.GaussianProcessRegressor

作为一个部分工作的示例，忽略内核定义以强调优化器：

import numpy as np
from scipy.optimize import minimize,least_squares
from sklearn.gaussian_process import GaussianProcessRegressor

def trust_region_optimizer(obj_func, initial_theta, bounds):
    trust_region_method = least_squares(1/obj_func,initial_theta,bounds,method='trf')
    return (trust_region_method.x,trust_region_method.fun)

X=np.random.random((10,4))
y=np.random.random((10,1))
gp = GaussianProcessRegressor(optimizer = trust_region_optimizer, alpha =1.2, n_restarts_optimizer=10)
gp.fit(X, y)

scipy 优化器返回一个结果对象，以 Rosenbrock 测试函数的最小化为例：

from scipy.optimize import least_squares,rosen
res=least_squares(rosen,np.array([0,0]),method='trf')

如上所示，可以使用以下方式访问优化值：

res.x

以及要最小化的函数的结果值：

res.fun

这就是“fun”参数所代表的意思。然而，现在优化器正在内部工作，您将需要从 scikit-learn 访问结果函数值：

gp.log_marginal_likelihood_value_

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

无法从 Func 转换为 Func

我对这个错误很困惑 Cannot implicitly convert type System Func
jQuery - 在单个事件处理程序中组合选择器的问题

这是关于 Patrick DW 对我对这个问题的回答的评论多个选择器确定触发选择器 https stackoverflow com questions 4315075 multiple selectors identify the tr
PHP include_once

使用 PHP 效率更高吗include once or require once而不是使用类似 C 的include带头护罩 I e include once init php versus include init php content
如何将 YouTube 句柄映射到频道 ID

YouTube 最近推出handles https www youtube com handle他们为用户提供了 youtube com xxx 类型的用户名当访问这些 URL 时会显示用户的频道但我在 API 存储库中找不到任何文档或
在 ASP.NET Core 中，IoC ASP 启动类是否解决了托管可扩展性框架通过目录和容器解决的问题？

我读过这篇文章 MEF 托管可扩展性框架与 IoC DI https stackoverflow com questions 108116 mef managed extensibility framework vs ioc di但它已经
centos中前台运行mysql

我正在为 mysql 数据库构建 docker 镜像为此我必须在前台运行 mysql 而不是作为守护服务运行我正在使用 centos 基础镜像如何让mysql在前台运行如果你跑mysqld safe CMD mysqld safe
如何检查 $_GET 参数是否存在但没有值？

我想检查是否app参数存在于 URL 中但没有值 Example my url php app I tried isset and empty 但不起作用我以前见过它是怎么做的但我忘记了空是正确的你想同时使用 is set 和 e
在 hg 状态中显示重命名？

我知道 Mercurial 可以跟踪文件的重命名但我如何才能跟踪文件的重命名show当我这样做时我会重命名而不是添加删除hg status 例如而不是 A bin extract csv column pl A bin find m
如何在 matlab 中读取具有可变十六进制值列的文本文件？

我有一个相当大的文本文件超过 16 000 行其格式如下 ID Line Num Var Col Length Values HEX 45 00001 FFFF FFFF 0000 0000 45 00002 0000 0000 FFF
回形针：一个模型中存在多个“has_attached_file”

我的模型片段 attr accessible package1 file name package2 file name has attached file package1 has attached file package2 来自我的
.NET 类何时应重写 Equals()？什么时候不应该？

VS2005文档重载 Equals 和运算符的指南 C 编程指南 http msdn microsoft com en us library ms173147 28v vs 80 29 aspx部分状态不建议在非不可变类型中重写运算符
如何加快 Pandas 多级数据帧总和？

我正在尝试加快几个大型多级数据帧的求和速度这是一个示例 df1 mul df 5000 30 400 mul df to create a big multilevel dataframe let df2 df3 df4 df1 df1
如何从powershell获取返回值并将其放入批处理文件中？

我正在尝试使用命令从批处理文件执行 powershell Powershell namefile ps1 PowerShell 返回一些值 1 4 0 和 1 如何从批次中获取这些值当我使用 errorlevel 时它只返回0 这意味着
Delphi 快速应用程序开发在可重用性方面的最佳实践 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 使用Delphi开始新项目时如何提高
如何从 ASP NET Core 控制器获取 JWT 令牌？

我正在尝试向受保护的 API 发出请求因此我需要向 HttpClient 添加授权请求标头如下所示 client DefaultRequestHeaders Authorization new AuthenticationHeaderV
等待 Excel 使用 VBA 完成填充 Bloomberg 数据

我有一个包含约 300 000 个 BDH 公式的 Excel 工作表来下载证券价格我想要打开文件并获取所有价格将它们粘贴为值保存并关闭文件但是我不知道 Excel 何时完成填充 Bloomberg 数据因此很难确定执行 2
使用 DirectShow 获取 MP4 文件持续时间

我需要获取 mp4 文件的持续时间最好是以秒为单位的双倍时间我正在使用 DirectShow 请参阅下面的代码但它不断抛出一个特别无用的错误我想知道是否有人有一个简单的解决方案说真的谁知道获取这些信息会如此困难 public s
设置新发布管道时，Azure DevOps 服务连接不显示

我已在 Azure DevOps 中设置了到我的 Azure 订阅的服务连接它使用证书进行连接当我创建新管道并选择任务时Azure App Service Deploy 在 Azure 订阅的下拉框中我在可用 Azure 服务连接
使用 OpenCV 测量物体的表观长度（以像素为单位）

我用过从不同角度姿势渲染 3D 对象的不同图像该对象具有彩色边缘如图所示现在我的目标是测量橙色和蓝色边缘的长度 Lo 和 Lb 以像素为单位使用 OpenCV 如果边缘由单个像素组成即由单个边缘组成的线那么这将是一项简单的任
使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数

平方指数或RBF核的基本方程如下这里 l 是长度尺度 sigma 是方差参数长度比例控制两个点的相似程度因为它只是放大 x 和 x 之间的距离方差参数控制函数的平滑程度我想用我的训练数据集优化训练这些参数 l 和 sigma 我

使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数

使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数 的相关文章

随机推荐

热门标签

使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数的相关文章