如何加速sklearn SVR？

2024-04-15

我正在实施SVR http://en.wikipedia.org/wiki/Support_vector_machine#Regression using sklearn http://scikit-learn.org/stable/python 中的 svr 包。我的稀疏矩阵的大小为 146860 x 10202。我将其划分为大小为 2500 x 10202 的各个子矩阵。对于每个子矩阵，SVR 拟合大约需要 10 分钟。有哪些方法可以加快这一过程？请建议任何不同的方法或不同的 python 包。谢谢！

您可以对 SVR 子模型预测进行平均。

或者，您可以尝试在核扩展的输出上拟合线性回归模型尼斯特罗姆法 http://scikit-learn.org/dev/modules/kernel_approximation.html.

或者您可以尝试其他非线性回归模型，例如随机树集成或梯度增强回归树。

Edit：我忘了说：内核 SVR 模型本身不可扩展，因为它的复杂性超过二次方，因此无法“加速”。

Edit 2：实际上，经常将输入变量缩放为[0, 1] or [-1, 1]或使用单位方差StandardScaler可以大大加快收敛速度。

此外，默认参数不太可能产生良好的结果：您必须网格搜索最佳值gamma也许还有epsilon在拟合大型模型之前，先对尺寸不断增加的子样本进行分析（以检查最佳参数的稳定性）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

SVM

sparsematrix

scikitlearn

如何加速sklearn SVR？的相关文章

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表所以我希望输出看起来像这样 Database Table name Database1 Table 1 Database1 Table 2 Database1 Table
Python：在列表理解本身中引用列表理解？

这个想法刚刚出现在我的脑海中假设您出于某种原因想要通过 Python 中的列表理解来获取列表的唯一元素 i if i in created comprehension else 0 for i in 1 2 1 2 3 1 2 0 0 3
ROC曲线和libsvm

给定一条 ROC 曲线plotroc m see here http www csie ntu edu tw cjlin libsvmtools roc curve for binary svm 理论问题如何选择要使用的最佳阈值编程问题
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
使用 on_bad_lines 将 pandas.read_csv 中的无效行写入文件

我有一个 CSV 文件我正在使用 Python 来解析该文件我发现文件中的某些行具有不同的列数 001 Snow Jon 19801201 002 Crom Jake 19920103 003 Wise Frank 19880303 l
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Python 函数可以从作用域之外赋予新属性吗？

我不知道你可以这样做 def tom print tom s locals locals def dick z print z name z name z guest Harry print z guest z guest print di
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class

随机推荐

如何让用户能够使用我的应用程序播放视频？

昨晚刚刚花了几个小时为 Honeycomb 开发了一个非常漂亮的视频播放器现在我当然希望人们能够使用它如何让我的应用程序监听接收视频播放广播我猜这与manifest xml文件但我无法在 Android 开发者网站上找到任何有关
然后 Groupby 检查行匹配并计算该值的并发实例数

我有这个数据框 car color years max years 0 audi black 1 7 1 audi blue 2 7 2 audi purple 4 7 3 audi black 6 7 4 bmw blue 1 5 5 b
为什么 CAS（原子）操作比同步或易失性操作更快

据我了解 synchronized关键字将本地线程缓存与主内存同步 volatile 关键字基本上总是在每次访问时从主内存中读取变量当然访问主内存比本地线程缓存要昂贵得多因此这些操作的成本很高然而 CAS 操作使用低级硬件操作但仍
有条件的 Mercurial 忽略文件

我在 Mercurial 中有一个文件我希望开发机器提取该文件但我希望部署服务器不提取该文件它具有开发机器没有的特殊模块这是可能的还是我应该有一个自定义的推送到服务器解决方案而不是仅仅进行 hg pull 执行此操作的典型方法是
H2O R api：从网格搜索中检索最佳模型

我正在使用h2oR 中的包 v 3 6 0 并且我构建了一个网格搜索模型现在我正在尝试访问最小化验证集上的 MSE 的模型在Python中sklearn 这在使用时很容易实现RandomizedSearchCV Pseudo code
如何将 Windows 桌面应用程序转换为 Mac 桌面应用程序？

我需要将 C NET Windows 桌面应用程序转换为 Mac 我读过有关 Qt REAL Studio LiveCode RunRev wxWidgets 和 Mono 的跨平台方面的内容 www mono project com 和h
如何使用 Maven 在构建时正确增强类？ OpenJPA

我在尝试着enhance 实体类所以我不会得到这个异常 Exception in thread main
CGImageRelease：[不是类型发布]：发送到已释放实例的消息

我在代码 CGImageRelease imageToSave 的最后一行收到此错误不是类型发布消息发送到已释放的实例请解释原因以及我需要使用什么来修复它我正在使用 ARC 但我认为这不适用于 CG 对象在测试代码是否有效后我
地理编码器可使用两个地址

带有 Geocoder gem 的 Rails 4 1 3 应用程序在模型上具有以下属性 t decimal origin lon precision gt 15 scale gt 10 t decimal origin lat preci
C# Ghostscript 包装器

有没有人遇到过 C 中 GhostScript 的一个很好的包装器我的具体用途是把postscript转成pdf Matthew Ephraim 创建了一个非常简单的 C 包装器名为 GhostScriptSharp 它使用 P Inv
支持异步操作并遵守超时的.NET TcpClient/NetworkStream 实现

根据问题数量论坛帖子等 BCL 中的 TcpClient NetworkStream 实现似乎缺乏对取消 IO 操作的适当支持随着 NET 4 5 中添加异步方法这种取消或适当的超时支持的缺乏使事情变得更加令人沮丧因为在执行 I
如何使用Python 2.7.8 |Anaconda 2.1.0（32位）加载png图像？

我使用 Anaconda 下载 Python 2 7 我使用的是Windows 7 我尝试了以下操作 from Tkinter import Tk Frame Canvas import ImageTk t Tk t title Trans
在 F# 列表中键入扩展名

假设我有一个类型 let MyType some info 但是它通常用于列表 MyType list 所以我可以定义 let MyTypeList MyType list 有没有办法在 MyTypeList 上定义类型增强我的实际情况
在添加较少支持期间无法在下一个 js 中设置未定义的属性“样式”

我正在尝试使用 antd 设计向我的下一个 js 项目添加对 less 文件的支持但无法设置未定义的属性样式我想自定义 antd 主题但该错误对我来说是一个障碍任何人有任何想法请帮助我解决这个问题 error screenshot
Xcode 本地化更新

因此我使用 Use Base Internationalization 在 Xcode 中本地化了故事板我进去翻译了字符串文件中的所有字符串耶那花了很长时间现在我在故事板的基本文件中添加了一个新元素它有一个标签其中有一个我需
将其他参数添加到来自 youtube 的 yt.player 对象

我正在使用 yt player 启动 YouTube 视频如下所示 function onYouTubeIframeAPIReady player new YT Player player height 720 width 1280 ht
将光标数据放入数组中

作为 Android 新手我在处理以下问题时遇到困难 public String getContacts Cursor cursor getReadableDatabase rawQuery SELECT name FROM contac
是否存在可以生成所有可能排列的交换序列？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 给你一个数字列表1 2 n 是否有一
mysql查询获取多个日期范围

我似乎在提出查询来实现我想要的目标时遇到了一些麻烦我有一张如下表 Date TIMESTAMP Count 2016 02 01 01 00 00 52 2016 01 05 11 30 00 14 2016 02 01 04 20 00
如何加速sklearn SVR？

我正在实施SVR http en wikipedia org wiki Support vector machine Regression using sklearn http scikit learn org stable python

如何加速sklearn SVR？

如何加速sklearn SVR？ 的相关文章

随机推荐

热门标签

如何加速sklearn SVR？的相关文章