R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

2024-01-27

我正在尝试获取可变重要性对于a的所有预测变量（或变量，或特征）调优支持向量机 (SVM)模型使用e1071::svm通过mlr- 封装在R。但我不确定我的评估是否正确。好吧，一开始的想法是：

为了获得诚实调整的 svm 模型，我遵循嵌套重采样教程 https://mlr-org.github.io/mlr-tutorial/devel/html/nested_resampling/index.html使用空间 n 重交叉验证（SpRepCV）在外循环和空间交叉验证（SpCV）在内循环中。作为调整参数gamma and cost在随机网格搜索中进行调整。作为所有预测变量的变量重要性评估，我想使用permutation.importance，即与描述 https://mlr-org.github.io/mlr-tutorial/devel/html/filter_methods/index.html，基本上是特征排列和未排列预测之间的聚合差异。

In mlr，有一些过滤函数 https://mlr-org.github.io/mlr-tutorial/devel/html/feature_selection/index.html获得变量重要性，但同时在基于用户特定选择输入（阈值或变量数量）的模型拟合之前创建子集。 - 但是，我想检索每个拟合模型的所有变量的变量重要性。（我知道学习者作为random forest有重要评价“包容”）

现在，我正在使用mlr::generateFeatureImportanceData https://www.rdocumentation.org/packages/mlr/versions/2.10/topics/generateFeatureImportanceData in the extract-重采样中的参数，看起来真的很尴尬。所以我想问一下，有没有更简单的方法呢？

这里有一个使用的例子mlr-开发版本：

## initialize libraries
# devtools::install_github("mlr-org/mlr) # using developper version of mlr
if(!require("pacman")) install.packages("pacman")
pacman::p_load("mlr", "ParamHelpers", "e1071", "parallelMap")


## create tuning setting
svm.ps <- ParamHelpers::makeParamSet(
  ParamHelpers::makeNumericParam("cost", lower = -12, 
                                 upper = 15, trafo = function(x) 2^x),
  ParamHelpers::makeNumericParam("gamma", lower = -15, 
                                 upper = 6, trafo = function(x) 2^x)
)

## create random search grid, small iteration number for example
ctrl.tune <- mlr::makeTuneControlRandom(maxit = 8) 

# inner resampling loop, "
inner <- mlr::makeResampleDesc("SpCV", iters = 3, predict = "both")

# outer loop, "
outer <- mlr::makeResampleDesc("SpRepCV", folds = 5, reps = 2, predict = "both")


## create learner - Support Vector Machine of the e1071-package
lrn.svm <- mlr::makeLearner("classif.svm", predict.type = "prob")

# ... tuning in inner resampling
lrn.svm.tune <- mlr::makeTuneWrapper(learner = lrn.svm, resampling = inner, 
                                     measures = list(auc),
                                     par.set = svm.ps, control = ctrl.tune, 
                                     show.info = FALSE) 


## create function that calculate variable importance based on permutation 
extractVarImpFunction <- function(x)
{
  list(mlr::generateFeatureImportanceData(task = mlr::makeClassifTask(
                          id = x$task.desc$id, 
                          data = mlr::getTaskData(mlr::spatial.task, subset = x$subset), 
                          target = x$task.desc$target,
                          positive = x$task.desc$positive, 
                          coordinates = mlr::spatial.task$coordinates[x$subset,]),
                        method = "permutation.importance", 
                        learner = mlr::makeLearner(cl = "classif.svm", 
                                                     predict.type = "prob", 
                          cost = x$learner.model$opt.result$x$cost,
                          gamma = x$learner.model$opt.result$x$gamma),
                        measure = list(mlr::auc), nmc = 10
                          )$res
      )
}



## start resampling for getting variable importance of tuned models (outer)

# parallelize tuning
parallelMap::parallelStart(mode = "multicore", level = "mlr.tuneParams", cpus = 8)

res.VarImpTuned <- mlr::resample(learner = lrn.svm.tune, task = mlr::spatial.task, 
                                 extract = extractVarImpFunction,
                                 resampling = outer, measures = list(auc), 
                                 models = TRUE, show.info = TRUE)

parallelMap::parallelStop() # stop parallelization

## get mean auroc decrease
var.imp <- do.call(rbind, lapply(res.VarImpTuned$extract, FUN = function(x){x[[1]]}))
var.imp <- data.frame(AUC_DECR = colMeans(var.imp), Variable = names(colMeans(var.imp)))

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？的相关文章

使用 R Shiny 从 XLConnect 下载 Excel 文件

有没有人尝试过使用 R Shiny 中的下载处理程序通过 XLConnect 下载新创建的 Excel 文件在 ui R 中有一行不起眼的行 downloadButton downloadData Download 在 server R
如何在R中计算文本中的句子数？

我使用 R 将文本读入readChar 功能我的目的是测试文本句子中字母 a 出现次数与字母 b 出现次数一样多的假设我最近发现了 stringr 包它帮助我对文本做很多有用的事情例如计算字符数以及整个文本中每个字母出现的总数现在
基于服务器中的条件逻辑呈现闪亮的用户输入

我正在尝试设置一个闪亮的导航栏面板页面其中用户控制我根据一组单选按钮中所做的初始选择来显示更改我直接在 ui 中渲染单选按钮然后在 Server r 中的观察到的逻辑控制结构内构建条件控件弹出错误是因为我的初始 if 语句计算结
R::bigmemory - 如何创建角色big.matrix？

我尝试使用bigmemory封装在R我一开始就陷入困境我愿意 temp lt matrix paste a 1 10 5 2 并得到一个字符矩阵没关系但后来我尝试 x lt as big matrix temp type char 我
返回数据帧 R 中的下一行

我有一个看起来像这样的数据框 kind datetime book 2016 04 23 04 23 00 pen 2016 04 23 04 30 00 toy 2016 04 23 06 45 00 我想为数据集中的每一行返回下一行的日
R 中具有稳健回归的异常值

我正在使用lmrobR 中的函数使用robustbase用于稳健回归的库我会把它用作 rob reg lt lmrob y 0 dat method MM control a1 当我想返回我使用的摘要时summary rob reg 稳健
numpy.histogram 的 hist 维度，密度 = True

假设我有这个数组 A array 0 0019879 0 00172861 0 00527226 0 00639585 0 00242005 0 00717373 0 00371651 0 00164218 0 00034572 0 008
R foreach问题（某些进程返回NULL）

我遇到了问题foreach我正在 R 中使用的程序的一部分该程序用于运行不同参数的模拟然后将结果返回到单个列表然后用于生成报告当并非所有分配的模拟运行都在报告上实际可见时就会出现问题从各方面来看似乎只有分配的运行的一个子集实际
R - Plm 和 lm - 固定效应

我有一个平衡面板数据集 df 本质上由三个变量组成 A B and Y 对于一堆独特识别的区域来说它会随着时间的推移而变化我想运行一个回归其中包括区域下面等式中的区域和时间年份固定效应如果我没记错的话我可以通过不同的方式来
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
尝试读取 CSV 文件时出现“无法识别的字符串转义”

我正在尝试导入一个 csv文件以便我可以观看此视频 R ggplot2 图形直方图 http www youtube com watch v 47kWynt3b6M 我安装了所有正确的软件包包括ggplot以及相关的包视频中的第一个说
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
在 R 中创建虚拟变量，排除某些情况为 NA

我的数据看起来像这样 V1 V2 A 0 B 1 C 2 D 3 E 4 F 5 G 9 我想创建一个虚拟变量R where 0 1 1 2 3 4 and NA 0 5 9 应该很简单有人可以帮忙吗我们可以转换V2 into a fa
在 R 格子包中微调点图

我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域我有三个变量方案指定所使用的算法数据集是正在测试算法的数据集以及 Area under ROC 我正在 R 中使用lattice库命令如下点图方案 Area und
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o

随机推荐

ANT - 无法加载依赖类 com/jcraft/jsch/Logger

我的 Ant 脚本有问题我需要将文件复制到 Linux 服务器
go 中 ioutil.ReadAll 的替代方案？

对于我正在制作的程序此函数作为 for 循环中的 goroutine 运行具体取决于传入的 url 数量没有设定数量 func makeRequest url string ch chan lt string errors map s
当两个超类具有同名但签名不同的成员函数时，存在歧义

struct A void f int x struct B template
安装了Visual Studio 2010 SP1，仍然不支持CSS3和HTML5

我已从以下位置下载了最新版本的 Visual Studio 2010 Service Pack 1 here http www microsoft com download en details aspx id 23691 然而在我提取文
如何在分解时间序列图中自定义标题、轴标签等

我相当熟悉通过编写自己的 x 轴标签或主标题来修改绘图的常用方法但在绘制时间序列分解的结果时我无法自定义输出例如 library TTR t lt ts co2 frequency 12 start 1 deltat 1 12 td
测试小程序的最佳机制是什么？

我正在尝试有效地为小程序构建一个功能测试套件并且我正在尝试为其找到一个好的框架过去当我想设计一个测试套件来对应用程序进行功能测试和负载测试时它始终是基于 Web 的应用程序或者至少是某种基于服务的应用程序并且我已经使用grind
如何在http get请求中设置标头？

我正在 Go 中执行一个简单的 http GET client http Client req http NewRequest GET url nil res client Do req 但我找不到自定义请求标头的方法doc http go
如何获取维基数据上所有电影的列表？

我正在使用 Freebase 为我的网站获取所有电影但它很快就会被关闭所以我在寻找另一个免费的电影数据库并发现了维基数据说实话如何查询所有电影太复杂了所以我想你们可以帮助我获取维基数据中的所有电影将来我还想加入电视节目和连续剧
jQuery - 对数组进行排序？

我使用 Ajax 获取一些 XML 然后用结果填充表单上的一些字段表单上有一个数字字段我想按该数字对结果进行排序从高到低的在前我将如何在 jQuery 中做到这一点我的js函数代码目前是 function linkCounts w
运行时动态绑定和类继承之间的区别

我试图澄清动态语言 Python Ruby 和静态类型语言 java C 中运行时动态绑定和类继承的概念我不确定我是对还是错在 Python 和 Ruby 等动态语言中运行时动态绑定是作为鸭子类型实现的当解释器检查对象的类型时它检
新 Chrome 打包应用程序的最小/最大按钮在哪里？

我正在使用 Chrome 的开发通道 v23 并且正在使用新的Chrome 打包应用程序 http developer chrome com dev apps about apps html平台新平台的目的之一是将打包应用程序从浏览器中
卷积神经网络如何处理通道

我已经浏览了很多关于 CNN 通常处理多个通道例如 RGB 图像中的 3 个的方式的解释但我仍然不知所措当将 5x5x3 滤镜例如应用于 RGB 图像的补丁时会发生什么exactly发生实际上是每个通道分别发生 3 个不同的
JAXB 继承，解组到编组类的子类

我正在使用 JAXB 来读取和写入 XML 我想要的是使用基本 JAXB 类进行编组并使用继承的 JAXB 类进行解组这是为了允许发送方 Java 应用程序将 XML 发送到另一个接收方 Java 应用程序发送者和接收者将共享一个公共
带有前置零的“单位相关”CSS 属性值是否等同于相应的“无前置零”值？

我正在扫描一些样式表时发现其中使用了linear gradient with rgba 颜色停止点其中rgba数字使用了多个实例0而不是只有一个0 background image linear gradient to top left
外行人对 JavaScript 为什么有奇怪的浮动数学的解释 – IEEE 754 标准 [重复]

这个问题在这里已经有答案了当我对浮点数进行数学运算时我永远无法准确理解 JavaScript 到底发生了什么我一直非常害怕使用小数以至于我尽可能避免使用它们然而如果我知道 IEEE 754 标准的幕后发生了什么那么我就能够预测
NgbDatePicker - 如何将 longDate 字符串绑定到 [ngModel]？

我试图将格式化为 longDate 字符串的日期绑定到 ngbDatePicker 中的 ngModel 输入值例如当用户选择日期时我想显示 2017年1月15日而不是 2017 01 15 我知道 ngModel 仅绑定到 Ngb
用于渲染视频的 2d 上下文与 WebGL

我目前正在使用CanvasRenderingContext2D drawImage 将来自 RTC 媒体流的视频绘制到画布上不幸的是这会占用大量的 CPU 资源使用以下方法执行此操作会性能更高吗WebGLRenderingContex
我的自定义 UITableViewCell （使用故事板创建）内的对象为零

我通过以下步骤在我的 iPhone 应用程序中创建了一个自定义表格视图单元格在我的故事板中我创建了一个示例单元格将其拖入UILabel and a UIImageView 添加了新文件我将其作为其子类UITableViewCell
仅当目标不存在时，使用 Ansible 在远程系统上移动文件

我正在尝试编写一个 Ansible 角色来移动远程系统上的多个文件我找到了一个堆栈溢出帖子 https stackoverflow com a 24165405 1174185关于如何做到这一点本质上是说只需使用带有 mv 的命令模块
R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

我正在尝试获取可变重要性对于a的所有预测变量或变量或特征调优支持向量机 SVM 模型使用e1071 svm通过mlr 封装在R 但我不确定我的评估是否正确好吧一开始的想法是为了获得诚实调整的 svm 模型我遵循嵌套重采样教程

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？ 的相关文章

随机推荐

热门标签

R - mlr：是否有一种简单的方法可以在嵌套重采样（空间）中获得调整后的支持向量机模型的可变重要性？的相关文章