如何重现 Ridge(normalize=True) 的行为？

2024-05-17

这段代码：

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Ridge

X = 'some_data'
y = 'some_target'

penalty = 1.5e-5
A = Ridge(normalize=True, alpha=penalty).fit(X, y)

触发以下警告：

FutureWarning: 'normalize' was deprecated in version 1.0 and will be removed in 1.2.
If you wish to scale the data, use Pipeline with a StandardScaler in a preprocessing stage. To reproduce the previous behavior:

from sklearn.pipeline import make_pipeline

 - model = make_pipeline(StandardScaler(with_mean=False), Ridge())

If you wish to pass a sample_weight parameter, you need to pass it as a fit parameter to each step of the pipeline as follows:
kwargs = {s[0] + '__sample_weight': sample_weight for s in model.steps}
model.fit(X, y, **kwargs)

Set parameter alpha to: original_alpha * n_samples. 
  warnings.warn(
Ridge(alpha=1.5e-05)

但是这些代码给了我完全不同的系数，正如预期的那样，因为归一化和标准化是不同的。

B = make_pipeline(StandardScaler(with_mean=False), Ridge(alpha=penalty))
B[1].fit(B[0].fit_transform(X), y)

Output:

A.coefs[0], B[1].coefs[0]
(124.87330648168594, 125511.75051106009)

如果我设置结果仍然不匹配alpha = penalty * n_features.

Output:

A.coefs[0], B[1].coefs[0]
(124.87330648168594, 114686.09835548172)

虽然Ridge()使用的标准化与我预期的有点不同：

回归量 X 将通过减去均值并除以进行归一化 l2范数

那么使用岭回归和归一化的正确方法是什么？
考虑到l2-norm似乎是在预测、数据修改和再次拟合之后获得的
在使用 sklearn 的岭回归时，我没有想到什么，特别是在 1.2 版本之后

prepare data https://drive.google.com/file/d/1bu64NqQkG0YR8G2CQPkxR1EQUAJ8kCZ6/view用于实验：

url = 'https://drive.google.com/file/d/1bu64NqQkG0YR8G2CQPkxR1EQUAJ8kCZ6/view?usp=sharing'
url = 'https://drive.google.com/uc?id=' + url.split('/')[-2]
data = pd.read_csv(url, index_col=0)

X = data.iloc[:,:15]
y = data['target']

不同之处在于报告的系数normalize=True将直接应用于未缩放的输入，而管道方法将其系数应用于模型的输入，即缩放后的特征。

您可以通过乘以/除以特征的标准差来“标准化”（不幸的是该词的重载）系数。加上未来警告中建议的惩罚更改，我得到了相同的输出：

np.allclose(A.coef_, B[1].coef_ / B[0].scale_)
# True

（我已经测试过使用sklearn.datasets.load_diabetes.)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scikitlearn

statistics

如何重现 Ridge(normalize=True) 的行为？的相关文章

在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
优化 Keras 以使用所有可用的 CPU 资源

好吧我真的不知道我在说什么所以请耐心听我说我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络目前只是一个教程过去我一直使用我的旧 HP 笔记本电脑因为我有 Windows 和 Ubunt
PIL Image.size 返回相反的宽度/高度

使用PIL确定图像的宽度和高度在特定图像上幸运的是只有这一个但这很麻烦从 image size 返回的宽度高度是相反的图片 http storage googleapis com cookila 533ebf752b9d1f7c
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
Python Kivy - 在本机网络浏览器中打开 url 的应用程序

我尝试制作一个简单的应用程序在单击 Screen One 上的按钮后在 Kivy 中打开一个网页我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
spacy 如何使用词嵌入进行命名实体识别 (NER)？

我正在尝试使用以下方法训练 NER 模型spaCy识别位置人名和组织我试图理解如何spaCy识别文本中的实体但我无法找到答案从这个问题 https github com explosion spaCy issues 491在 Gi
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe

随机推荐

如何检测并找出程序是否陷入死锁？

这是一道面试题如何检测并确定程序是否陷入死锁是否有一些工具可用于在 Linux Unix 系统上执行此操作我的想法如果程序没有任何进展并且其状态为运行则为死锁但是其他原因也可能导致此问题开源工具有valgrind halgr
使用indexOf()函数时我应该重写哪个函数

在java中使用indexOf 函数时我应该重写哪个函数我有一个数组列表然后我接受一个输入作为 ID 并创建一个包含该 ID 的对象所有其他元素均为空然后我需要传递该对象并获取包含该对象的元素的索引 The equals 方法 ht
导出选定的行，其中按钮集合在数据表中不起作用

我正在尝试仅从数据表中导出选定的行通过将扩展选项设置为 csv 我可以成功将选定的行导出到 csv 文件如下面的代码所示 buttons colvis selectAll selectNone extend csv text Expor
OWIN 可以替代 ASP.NET MVC 应用程序中的 DI 吗？

大约一年前在 Visual Studio 中创建时自动生成的 MVC 项目不包含任何有关 OWIN 的内容作为再次申请并试图了解这些变化的人我想知道 OWIN 是否可以替代我的 DI 据我了解 Startup Auth cs 中的以下
Glew+GLFW Win32 无依赖项 Visual Studio

是否可以在不将文件复制到 C 的情况下构建并链接 Glew 和 GLFW 我找不到任何说明如何在不将 DLL 复制到 C 上的 Visual Studio 目录的情况下使用这些库的文档我只想包含项目目录中所需的所有 dll 和 lib 文
将数据追加到Python字典中

我使用以下代码从键列表中初始化字典 z df1 2 value counts keys tolist mydict dict fromkeys z None 此外我用过 value df2 2 value counts keys toli
如何使用 asyncio/aiohttp 确定最佳缓冲区大小

在 python 中使用 asyncio 时我们如何确定 read 的最佳参数 12字节 100 字节 async with self session get url headers headers as response chunk s
如何使 StringGrid 的列适合网格的宽度？

我已经寻找解决方案很长时间了但没有任何运气有谁知道一个简单的方法来做到这一点例如我想拉伸网格的第二列以适应网格的宽度 Use the ColWidths财产像这样 with StringGrid1 do ColWidths 1 C
具有动态警报正文的快速本地通知

所以我可以创建一个像这样的本地通知 var localNotification UILocalNotification localNotification fireDate NSDate timeIntervalSinceNow 7 loc
为什么 std::string 分配两次？

我写了一个自定义分配器std string and std vector如下 include
在GDB中的每一行设置断点

有没有办法用GDB在代码的每一行设置断点明明我不想打b addr对于每一行所以我想知道是否有一种快速的方法来做到这一点 Edit请注意我正在运行由其他人创建的二进制文件并且我无权访问源代码不幸的是该二进制文件尚未使用 g 标志进
覆盖供应商自动加载编辑器

有没有办法让您创建的自动加载文件在调用供应商自动加载之前运行我们似乎遇到了 SimpleSAML 的自动加载覆盖我们创建的自动加载文件之一的问题我是 Composer 的新手似乎无法在网上找到任何解决方案我尝试将我们的自动加载文件包
Django 中从 sqlite 迁移到 postgresql

我想迁移自sqlite to PostgreSQL db 我安装了 postgresql 并在其 shell 上创建数据库然后配置我的 django 设置如下 default ENGINE django db backends postg
在 Chrome 中使用 React 添加新的 DOM 项目不会保持预期的滚动位置

在 React 中向状态数组添加新项目时我遇到了一个意外的问题这会导致更多项目被添加到 DOM 中在 Safari 和 Firefox 中这会导致新的 DOM 项目添加到折叠下方我必须向下滚动才能看到新项目在 Chrome 中
Air for Android：动画导致我的游戏出现滞后

我正在为 android 平台制作一款 cs6 air 游戏当我为游戏制作动画时我使用 3D 软件搅拌器在 Blender 中我制作了一个动画然后将其渲染为一系列 PNG 图像并将其导入到 Flash CS6 中因此如果我要
如何创建不返回任何内容的函数

我想写一个函数pl pgsql 我在用着Postgres 企业管理器 v3并使用 shell 来创建一个函数但在 shell 中我必须定义返回类型如果我不定义返回类型我将无法创建函数如何创建一个不返回结果的函数即创建一个新表的函数
显示即将到来的 Facebook 好友生日

我仍然得到列表脸书好友以的形式一月至十二月按升序排列见下图但现在我想以以下形式显示 Facebook 好友列表即将到来的生日 Like 最近的热门内容我使用以下查询来获取好友列表 Log d LOG TAG requestFrien
寻找网站测试自动化的方法

我们开发定制调查网站我正在寻找一种方法来自动化这些网站的模式测试调查通常包含许多复杂的规则和分支这些规则和分支也会根据项目的响应方式而触发所有调查在发布给客户之前都经过严格测试此测试需要大量的手动工作我想了解一些可以通过回答问题
良好的错误处理实践

对于 ASP NET 站点来说什么是良好的错误处理实践例子谢谢与任何 net 项目一样我发现最好的方法是仅捕获可能发生在给定页面上的特定错误类型例如您可以捕获用户给定输入的格式异常以防 JavaScript 验证失败并且您没
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod

如何重现 Ridge(normalize=True) 的行为？

如何重现 Ridge(normalize=True) 的行为？ 的相关文章

随机推荐

热门标签

如何重现 Ridge(normalize=True) 的行为？的相关文章