R 插入符 / rfe 变量选择 Factor() AND NA

2023-11-29

我有一个数据集NAs慷慨地撒在各处。

此外，它还有需要的列factors().

我正在使用rfe()函数从caret包来选择变量。

看来functions=论证中rfe() using lmFuncs适用于具有 NA 的数据，但不适用于因子变量，而rfFuncs适用于因子变量，但不适用于 NA。

对于处理这个问题有什么建议吗？

I tried model.matrix()但这似乎只会引起更多问题。

由于包之间在这些点上的行为不一致，更不用说使用更多“元”包时的额外技巧了，例如caret，我总是发现在进行任何机器学习之前，预先处理 NA 和因子变量会更容易。

对于 NA，忽略或估算（中位数、knn 等）。
对于因子特征，您走在正确的轨道上model.matrix()。它可以让您为不同级别的因子生成一系列“虚拟”特征。典型的用法是这样的：

> dat = data.frame(x=factor(rep(1:3, each=5)))
> dat$x
 [1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
Levels: 1 2 3
> model.matrix(~ x - 1, data=dat)
   x1 x2 x3
1   1  0  0
2   1  0  0
3   1  0  0
4   1  0  0
5   1  0  0
6   0  1  0
7   0  1  0
8   0  1  0
9   0  1  0
10  0  1  0
11  0  0  1
12  0  0  1
13  0  0  1
14  0  0  1
15  0  0  1
attr(,"assign")
[1] 1 1 1
attr(,"contrasts")
attr(,"contrasts")$x
[1] "contr.treatment"

另外，以防万一您还没有（尽管听起来像您有），caretCRAN 上的小插图非常好，涉及其中一些要点。http://cran.r-project.org/web/packages/caret/index.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rcaret

R 插入符 / rfe 变量选择 Factor() AND NA 的相关文章

查找嵌套列表中元素的索引？

我有一个类似的列表 mylist lt list a 1 b list A 1 B 2 c list C 1 D 3 是否有一种无循环方法来识别元素的位置例如如果我想用 5 替换 C 的值并且在哪里找到元素 C 并不重要我可以这样
简单的数据框重塑

我刚刚从长时间的写作中断中回到 R 并且在记住如何重塑数据方面遇到了一些实际问题我知道我想做的事情很容易但出于某种原因我今晚很愚蠢并且将自己与融化和重塑混淆了如果有人能快速指出我正确的方向我将不胜感激我有一个这样的数据框 pe
有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
用于清除工作空间和转储存储的 R 全局函数

我希望创建一个全局函数来清除我的工作区并转储我的内存我将我的函数称为 cleaner 并希望它执行以下代码 remove list ls gc 我尝试在全局环境中创建该函数但是当我运行它时控制台仅打印该函数的文本在我要获取的函数文件
dplyr 中的 Summarize 是否可以不删除数据框中的其他列？

我有一个包含三列的数据框我正在尝试进行简单的总结以查找数据框中每个城市的最高温度但同时保留每个最高温度列出的日期这是数据框我们称之为 maxT new ID Date Max TemperatureF 1 TUS 1960 04 0
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
R：将 readRDS 应用于 .Rds 文件名的列表对象

我有几个包含数据帧对象的 Rds 文件我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中但是当我尝试从文件名列表中读取多个 Rds 文件时我收到错误 FUN X i 中的错误从连接读取时出错 readRDS 不适用于列表吗 R
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST
R 更改小数位且不四舍五入

gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
使用predictNLS围绕R中的拟合值创建置信区间？

我想使用 R 中 propogate 包中的 PredictNLS 围绕一大组拟合值构建置信区间作为示例我将使用它们在函数描述中引用的数据集 https rdrr io github anspiess propagate man pre
单击 R 中的 Sankey Chart 线时添加额外的标签值

以下 R 闪亮脚本创建一个桑基图如下面的快照所示我的要求是当我单击左右节点之间的任何链接即 a1 和 a2 时我希望相应的 a3 的总和出现在标签中例如 a1 中的 A 和 a2 中的 E 总共具有值 50 和 32 因此我想

随机推荐

Paper.js 外部文件将无法加载

我只是想进入 paper js 内联时代码可以正常工作但是当我将它们移动到外部文件并在那里 src 时错误开始弹出任何人都可以弄清楚我做错了什么吗附有错误屏幕截图非常感谢错误截图
PHP 在 if 语句中组合布尔运算符（AND、OR）

我想知道是否可以将两个运算符 OR 和 AND 组合在一个 if 语句中如下所示 if apple 1 orange 2 cake 0 我想说的是如果苹果等于 1 橙子等于 2 或者蛋糕等于 0 那么就这样做换句话说我需要苹果和橙子
Python：如何按每个元素的最大值对列表进行排序？

L a b c d e f 我想按 max a b max c d max e f 等对其进行排序您可以提供定制key函子到sort L sort key max
如何获取 postgresql 9.5 中特定模式中存在的所有表的表行数？

如何获取 postgresql 9 5 中特定模式中存在的所有表的表行数我希望结果为 table name 行数如何使用查询来完成此操作这可以通过一些 XML 魔法来完成 select table schema table name
Discord.py：为什么我的加入消息不起作用？

我很困惑为什么我的加入消息不起作用我安装了discord py库我真的很困惑我下面还有其他代码但它不应该影响上面的代码 import discord client discord Client client event async
ASP.NET Core Identity - 获取当前用户

为了获取 MVC5 中当前登录的用户我们所要做的就是 using Microsoft AspNet Identity Authorize public IHttpActionResult DoSomething string curren
.htaccess 中的条件 PHP 版本

在我的本地测试服务器上我使用 PHP 5 4 然而在实时主机上我目前仅限于 PHP 5 3 并且必须在 htaccess 中指定它否则默认为 5 2 所以我可以添加 Use PHP 5 3 Action application x
写入记录器时发生错误。（无法打开源“.NET Runtime”的日志。您可能没有写入权限。）

我在 Net core 3 1 中创建了一个 Web 应用程序并尝试使用 EF Core 访问数据库在访问它时我遇到以下错误奇怪的是它之前可以正常工作但应用程序方面没有任何变化 at Microsoft Extensions L
如何在mysql中对西里尔字母进行编码？

这是怎么回事我有一个问题希望你能帮助我解决我的一个朋友有一个简单可靠的 html 网站我实现了一点 php 文章的 CRUD 系统我遇到的问题是从 mysql 数据库放置和获取西里尔字符我接下来想要实现的目标是在主导航中有一
了解地图功能

Python 2 文档说内置功能 map function iterable 将函数应用于可迭代的每个项目并返回一个列表结果如果传递额外的可迭代参数函数必须接受这么多参数并应用于所有项目并行迭代如果一个迭代比另一个短则假定它
使用functions.php将Bootstrap添加到Wordpress

我尝试使用以下代码将 Bootstrap 嵌入到 Wordpress 但它不起作用需要帮忙
设置用双引号括起来的单词的 CSS

这是我的问题的后续问题如果代码包含保留字则设置代码的 CSS 我正在尝试做什么如果某些代码有引号或双引号我想将字体颜色设置为红色和粗体前任 System out println Hello world 应该将 Hello world
如何使 PageView.Builder() 滚动动画从滞后变得极其流畅 - Flutter

我使用 PageView Builder 来构建由基本文本小部件数组提供的小部件但在调试模式下动画感觉非常滞后在发布或分析模式下动画仍然滞后但少了很多有什么方法可以完全消除使用PageView时的动画滞后现象这是我的代码 im
如何从另一台计算机连接到 SQL Server？

我想使用 SQL Server 2005 从家里连接到另一台 PC 我查看了 msd 但在连接之前它说我应该连接到另一台计算机使用计算机管理但没有成功我只能连接到我的工作组中的计算机谢谢路易莎免责声明这只是一些可能对任何人都有帮助
提取C/C++函数原型

我想做这个 extract prototypes file1 c file2 cpp file3 c 并让任何脚本程序打印给定 C C 文件中定义的所有函数的函数原型的良好列表它必须很好地处理多行声明有没有一个程序可以完成这项工作越
Python 的 eval() 在不受信任的字符串上的安全性？

如果我使用 eval 评估 Python 字符串并且有一个类似以下的类 class Foo object a 3 def bar self x return x a 如果我不信任该字符串会有哪些安全风险尤其 Is eval strin
计算不同数字数量的省时方法

get number 返回一个整数我将调用它 30 次并计算返回的不同整数的数量我的计划是将这些数字放入std array
C++ 在编译时获取月份作为数字

我有一个 C 项目必须打印修订字符串修订字符串是公司指定的协议包括构建时间 yyyy mm dd 我过去常常将其指定为构建系统中的宏但这不再是一个选项因为会弄乱预编译头在增量构建中当日期发生变化时我试图通过从编译器获取构建日
表达式引擎 - 完全删除index.php

一段时间以来我一直在 htaccess 文件中使用以下代码以使 EE URL 正常工作而无需在 URL 中使用 index php 我发现虽然我从爬行工具中收到一些报告但我得到了重复的内容如 lorem ipsum 也以 ind
R 插入符 / rfe 变量选择 Factor() AND NA

我有一个数据集NAs慷慨地撒在各处此外它还有需要的列factors 我正在使用rfe 函数从caret包来选择变量看来functions 论证中rfe using lmFuncs适用于具有 NA 的数据但不适用于因子变量而rfFu

R 插入符 / rfe 变量选择 Factor() AND NA

R 插入符 / rfe 变量选择 Factor() AND NA 的相关文章

随机推荐

热门标签