使用 caret 包应用 k 折交叉验证模型

2023-11-24

首先我要说的是，我读过很多关于交叉验证的帖子，但似乎存在很多混乱。我的理解很简单：

执行 k 倍交叉验证，即 10 倍，以了解 10 倍的平均误差。
如果可以接受，则在完整的数据集上训练模型。

我正在尝试使用构建决策树rpart在 R 中并利用caret包裹。下面是我正在使用的代码。

# load libraries
library(caret)
library(rpart)

# define training control
train_control<- trainControl(method="cv", number=10)

# train the model 
model<- train(resp~., data=mydat, trControl=train_control, method="rpart")

# make predictions
predictions<- predict(model,mydat)

# append predictions
mydat<- cbind(mydat,predictions)

# summarize results
confusionMatrix<- confusionMatrix(mydat$predictions,mydat$resp)

我有一个关于插入符序列应用程序的问题。我读过了插入符包的简短介绍训练部分指出在重采样过程中确定“最佳参数集”。

在我的例子中，我的编码正确吗？我需要定义rpart我的代码中的参数或者我的代码是否足够？

当您执行 k 倍交叉验证时，您已经对每个样本进行了预测，即超过 10 个不同的模型（假设 k = 10）。无需对完整数据进行预测，因为您已经从 k 个不同模型中获得了预测。

您可以执行以下操作：

train_control<- trainControl(method="cv", number=10, savePredictions = TRUE)

Then

model<- train(resp~., data=mydat, trControl=train_control, method="rpart")

如果您想以良好的格式查看观察到的结果和预测，您只需输入：

model$pred

另外，对于问题的第二部分，插入符应该处理所有参数。如果需要，您可以手动尝试调整参数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

crossvalidation

rcaret

rpart

使用 caret 包应用 k 折交叉验证模型的相关文章

如何在R中得到一个大的稀疏矩阵？ (> 2^31-1)

我使用一些 C 代码从数据库中获取文本文件并从该文件创建 dgcMatrix 类型稀疏矩阵Matrix包裹我第一次尝试构建一个具有超过 2 31 1 个非稀疏成员的矩阵这意味着稀疏矩阵对象中的索引向量也必须比该限制长不幸的是向量似
在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
R - 正则表达式错误（PCRE 版本）

我正在尝试使用koRpus在 R 中在运行 RHEL6 的 Linux 服务器上进行词形还原上周当我安装了 MRO Microsoft R Open 3 2 3 时下面的代码效果很好 library koRpus lw c danci
可以明确声明包依赖项的版本吗？

我倾向于对我编写的代码进行明确而不是隐含的描述因此在成功创建自己的包之后我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性其中一部分与我的包所依赖的包有关实际问题在这方面是否可以明确声明需要期望哪个版本的包依赖项我正
如果“testthat”测试在“R”中失败，则打印自定义诊断信息

I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同如果测试失败 testthat打印一些诊断信息例如 MyFunction df orig is not identical to
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
将值替换为其各自列的名称

我有一个数据框 Code 401k CVS 101A true 231N true FD54 true 99JB 85F4 true 我试图用相应的列名称例如 401k 替换 true 字符值这是我想要的输出 Code 401k CVS
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
有没有一种简单的方法来判断存储在一个列表中的许多数据帧是否包含相同的列？

我有一个包含许多数据框的列表 df1 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df2 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df3 lt data frame
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
R：将 JSON 时间格式转换为 POSIX

我有一个 JSON 字符串并将其放入数据框中我能够做到这一点但我在使用 apply 函数之一将所有时间字符串转换为 POSIX 格式时遇到问题 See here https stackoverflow com questions 90
ggplot散点图中的图例问题

我想使用 ggplot 创建显示方法比较数据的散点图绘图应包含原始数据理想线和带误差的拟合线图例应显示理想线和拟合线的线型线宽线颜色我可以获得大部分我想要的东西但是图例存在以下问题图例显示每种线型有 2 条线为什么如何解
在 R 中使用 Huggingface Transformer 模型

我正在尝试在 R 中使用不同的 Huggingface 模型这是通过 reticulate 导入 Transformer 包来实现的谢谢 https rpubs com eR ic transfoRmers https rpubs co
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
单击 R 中的 Sankey Chart 线时添加额外的标签值

以下 R 闪亮脚本创建一个桑基图如下面的快照所示我的要求是当我单击左右节点之间的任何链接即 a1 和 a2 时我希望相应的 a3 的总和出现在标签中例如 a1 中的 A 和 a2 中的 E 总共具有值 50 和 32 因此我想

随机推荐

假执行Powershell脚本

在 Fake 构建自动化工具中执行 Powershell 脚本的最佳方法是什么我觉得这个问题应该有一个明显的答案但一直没能通过搜索找到任何东西正如您在评论中提到的使用PowerShell类使这变得非常容易 r FakeLib dll
如何在反序列化期间以编程方式选择构造函数？

我想反序列化System Security Claims Claim对象按以下方式序列化 Issuer LOCAL AUTHORITY OriginalIssuer LOCAL AUTHORITY Type http my org ws 2
如何标准化 Lucene 分数？

我需要将 Lucene 分数标准化为 0 到 1 之间例如随机查询返回以下分数 8 864665 2 792687 2 792687 2 792687 2 792687 0 49009037 0 33730242 0 33730242
JavaScript 中的“变量 = 变量 || {}”是什么意思 [重复]

这个问题在这里已经有答案了变量的初始化代表什么 var variable variable 应该如何以及何时使用该行代码执行以下操作 IF variable未定义或具有错误值 THEN将其设置为空对象 ELSE什么都不做从技术上讲
java.lang.AbstractMethodError：javax.ws.rs.core.UriBuilder.uri

我尝试启动应用程序但使用Tomcat 7我有一个这样的例外我认为这可能是Maven dependency 但我确定如果有人知道发生了什么事请回答例外 message Servlet execution threw an except
C++ 按常量引用传递并按常量引用返回

我想了解退货是否有任何好处const参考我有一个阶乘函数通常如下所示 unsigned long factorial unsigned long n return n 0 1 n factorial n 1 我假设当我们经过时性能会有所
swift/ios 在后台刷新应用程序数据

我正在编写一个 iOS Swift 应用程序它每 X 分钟从 REST 服务读取数据并相应地更新 UI 现在我希望当应用程序置于后台时会以 X 分钟的间隔调用一个任务从 REST 服务读取数据并且如果刚刚读取的数据满足给定条件则显
我应该将实体框架视为非托管资源吗？

我正在使用一个在其构造函数中使用 EF 引用的类我已经实施了IDisposable 但我不确定是否需要析构函数因为我不确定是否可以将 EF 分类为非托管资源如果 EF 是托管资源那么我不需要析构函数所以我认为这是一个合适的示例 p
动画过渡在横向方向上无法正常工作

我的应用程序仅支持横向右方向我正在尝试转换到视图控制器的视图但是当它执行过渡动画例如卷曲时视图旋转 90 度因此模拟器仍处于横向右方向但视图显示为旋转 90 度过渡完成后它会旋转到正确的方向我的代码如下 IBActio
MATLAB 中的广义特征向量？

有没有一种方法可以在特征值多重性高的情况下使用单个或至少很少的命令来获取广义特征向量如果每个特征值的重数为 1 我可以使用 V D eig A 但此命令不适用于多个特征值根据 Matlab 文档 V D eig A B 生成广义特征值的
为什么使用 RelayCommand 或 DelegateCommand 而不是仅仅实现 ICommand？

我刚刚学习 WPF 中的 MVVM 我对 WPF 和 MVVM 都是全新的我了解它是如何工作的但从未使用过它我在网上找到的每一篇教程文章都使用 RelayCommand 或 DelegateCommand 在我看来这些模式迫使虚拟
Fstream 无法创建新文件

我在一个项目中使用文件管理器这样读写对我来说就不那么麻烦了或者说如果我没有花这么多时间调试它的话所以这个舒适舱实际上给我带来了压力和时间惊人的问题似乎是fstream 在继续之前先介绍一下 FileManager 类的结构
检测android webview

我有一个html javascript页面我需要检测它何时在网络视图上打开例如在 facebook webview twitter webview 等内部以及如果它是一个 webview 显示另一个内容 Note 我不控制第三方 An
错误：pandoc 文档转换失败，错误 43 Windows 7 R studio

我在论坛中搜索了答案但似乎不起作用我正在 Rstudio 中使用 knit 包编织一个 pdf 文档我使用的是 Windows 7 和 Rstudio pandoc exe Error producing PDF from TeX s
整数除法大量用于什么？

分析https ridiculousfish com blog posts benchmarking libdivide m1 avx512 html发现新的 Apple CPU 花费了大量资源来使整数除法速度大大加快这是一件令人惊讶的事
如何以编程方式向 UILabel 添加约束

有没有一种方法可以快速获得标签并以编程方式对其进行约束例如在所有设备上固定到顶部或固定到右侧以便在所有设备上它只固定到正在使用的任何设备这是因为我以编程方式创建了一个标签所以我想对其进行约束如果您需要更多信息请告诉我谢
d3 - 查看特定 x,y 位置有什么

我正在尝试在 d3 树中实现一些拖放功能其中当拖动节点时如果它直接到节点左侧 50 像素我想绘制一个虚线连接器来指示如果释放该节点应该是小时候搬到这里为了做到这一点我的想法是检查左侧 50 像素的元素有没有办法查看 d3 中特定
为什么无法通过新的 Azure 门户配置 Azure 诊断以使用 Azure 表存储？

我正在开发一个将托管在 Azure 中的 Web api 我想使用 Azure 诊断将错误记录到 Azure 表存储中在经典门户中我可以将日志配置为转到 Azure 表存储经典门户诊断设置然而在新的 Azure 门户中我唯一的存
在Windows Azure中使用Redis实现进程外缓存

我一直在开发一个网页该网页显示我在天蓝色云中的数据库中的表格为了减少直接调用数据库以提高性能我想为页面构建一个缓存目前我拥有一个内存缓存进程内 reads表的现在我想创建一个进程外缓存应该从什么时候更新writes进行意味着
使用 caret 包应用 k 折交叉验证模型

首先我要说的是我读过很多关于交叉验证的帖子但似乎存在很多混乱我的理解很简单执行 k 倍交叉验证即 10 倍以了解 10 倍的平均误差如果可以接受则在完整的数据集上训练模型我正在尝试使用构建决策树rpart在 R 中并利用c

使用 caret 包应用 k 折交叉验证模型

使用 caret 包应用 k 折交叉验证模型 的相关文章

随机推荐

热门标签

使用 caret 包应用 k 折交叉验证模型的相关文章