机器学习——交叉验证（留一法、自助法）

2023-10-27

文章目录

交叉验证的作用
留一法
自助法

交叉验证的作用

很多时候我们都在纠结，交叉验证法到底有啥用？？？我不用这个咋的？？

交叉验证是一种模型验证技术，可用于评估统计分析（模型）结果在其它独立数据集上的泛化能力。它主要用于预测，我们可以用它来评估预测模型在实践中的准确度。

准确来说：叫擦很严重就是来来回回反复的对模型进行刷新，最后得到的模型评估结果就是这K次验证的均值

from sklearn.model_selection import KFold

kf = KFold(n_splits = K, shuffle=True, random_state=0)
for train_index, test_index in kf.split(data):
    clt = model.fit(data[train_index], four_label[train_index])
    curr_score = curr_score + clt.score(data[test_index], four_label[test_index])
    print(clt.score(data[test_index], four_label[test_index]))

avg_score = curr_score / 5
print("平均准确率为：", avg_score)

留一法

如果当我们分出来的数据子集的数目和我们交叉验证的次数一样，那么就出现了留一法。

但是留一法在数据量较大的时候，大量的模型计算开销过于庞大。

自助法

采样源数据集D1得到D2，从D1中随机挑选出一个小样本，放入新数据集D2 ，但D1的数据集总量不变.这样可以提高小数据模型的准确性

lim ⁡ x → ∞ ( 1 − 1 m ) m = 1 e ≈ 0.368 \lim_{x \to \infty} (1−\frac{1}{m})^m=\frac{1}{e}≈0.368 limx→∞(1−m1)m=e1≈0.368

#自助法
import numpy as np
#任意设置一个数据集
X = [1,4,3,23,4,6,7,8,9,45,67,89,34,54,76,98,43,52]

#通过产生的随机数获得抽取样本的序号
bootstrapping = []
for i in range(len(X)):
    bootstrapping.append(np.floor(np.random.random()*len(X)))
#通过序号获得原始数据集中的数据
D_1 = []
for i in range(len(X)):
    D_1.append(X[int(bootstrapping[i])])
'''结果
[45, 52, 34, 9, 6, 54, 34, 1, 4, 54, 6, 8, 67, 4, 43, 9, 4, 67]
'''

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能

机器学习

python

机器学习——交叉验证（留一法、自助法）的相关文章

尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
下载 PyQt6 的 Qt Designer 并使用 pyuic6 将 .ui 文件转换为 .py 文件

如何下载 PyQt6 的 QtDesigner 如果没有适用于 PyQt6 的 QtDesigner 我也可以使用 PyQt5 的 QtDesigner 但是如何将此 ui 文件转换为使用 PyQt6 库而不是 PyQt5 的 py 文件
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

JETBRAIN系列IDE改变终端的字体

简介 JetBrains是一家捷克的软件开发公司该公司位于捷克的布拉格并在俄国的圣彼得堡及美国麻州波士顿都设有办公室该公司最为人所熟知的产品是Java编程语言开发撰写时所用的集成开发环境 PhpStorm IntelliJ IDEA
frame 和iframe 的区别以及和frameset 的关系及应用

1 frame不能脱离frameSet单独使用 iframe可以 2 frame不能放在body中如下可以正常显示
C#让panel显示滚动条

AutoScroll True AutoScrollMiniSize 450 450 设置逻辑区域尺寸如果它大于控件尺寸就会出现滚动条
ffmpeg命令行示例

在视频上覆盖一张照片 ffmpeg i video mkv i image png filter complex 0 v 1 v overlay out map out out mkv 生成5s的lavfi红色的视频 ffmpeg filt
mac brew安装 node 踩坑日记- n切换node不生效

最近用了一个旧电脑开发发现里面node管理混乱有nvm n和homebrew 导致切换node 切换不了开发也有莫名其妙的错误所以我打算重新装一下node 使用n做为管理工具 1 删除nvm cd rm rf nvm 2 删除n s
日语五十音图快速记忆法

平假名清音清音段段段段段行 a i u e o 行 ka ki ku ke ko 行 sa shi su se so 行 ta chi tsu te to 行 na ni nu ne no 行 ha hi fu he ho
持久内存服务器大多数数据库管理系统,内存数据库VS传统数据库：如何在多个任务之间共享内存中的数据？...

内存数据库 IMDB 将计算机数据存储在计算机的主存储器中而不是磁盘驱动器中以产生更快的响应时间访问存储在内存中的数据可节省从磁盘查询数据所需的时间依赖快速响应时间和实时数据管理的应用程序使用内存数据库受益于内存数据库的行业包括电
PHY芯片的使用（三）在U-boot下网络PHY的移植

1 概述以太网 PHY 驱动移植主要包括 Linux u boot 及设备树等三个方面标准框架下的移植本文以裕太8511PHY为例展开说明一般国产芯片厂商会提供在uboot linux下PHY的驱动在uboot linux的PHY
【MySQL入门指南】数据库基础DDL操作

文章目录 MySQL库操作一 SQL语句二创建数据库 1 语法 2 案例 3 极其不推荐的方式三查看数据库 1 语法四修改数据库五删除数据库六字符集与校验规则 1 是什么 2 相关指令 3 校验规则的影响七备份数据
国外程序员推荐的好书

1 代码大全史蒂夫迈克康奈尔 2 程序员修炼之道 3 计算机程序的构造和解释 4 C程序设计语言 5 算法导论 6 重构改善既有代码的设计 7 设计模式 8 人月神话 9 计算机程序设计艺术 10 编译原理龙书 11 深入浅出设计模
使用GPU进行神经网络计算详解

Pytorch学习笔记六使用GPU的简单LeNet网络模型中也提到了如何实现GPU上的运算虽然不详细但是也足够总结如果对于总结知识已经比较熟悉那么下面的详解可以不用看默认CPU进行计算 CPU上变量或模型不能与GPU上变量或
json转换javaBean属性值全null

今天遇到了这么一个问题解决办法分几步所有转换javaBean的实体类实现序列化接口将vo中不用于转换的属性剪掉设置redis序列化方式为如下 Bean public RedisTemplate
JAVA多线程

多线程 1 基本概念 1 1 程序进程线程程序完成一定功能的静态代码对比火车站售票厅进程正在执行的静态代码称为进程对比北京西站售票线程为了并发执行一些异步任务比对售票的中多个窗口单核cpu和多核cpu java程启
【机器学习】PCA、LDA、SVD

线性变换如果我们将向量 v 左乘矩阵 A 我们就会得到新的向量 b 也即可以表述说矩阵 A 对输入向量 v 执行了一次线性变换且线性变换结果为 b 因此矩阵运算 Av b 就代表向量 v 通过一个变换矩阵 A 得到向量 b 下面的实例
智慧用电安全云监控系统

近年来我国电气火灾频发 2017年至2019年我国共之间发生发展电气控制火灾31 1万起占全国进行火灾总量及伤亡风险损失的30 以上 2019年全年共接报火灾23 3万起电气火灾11 1万占52 深圳市荣健市场 12 11 重大火
[项目管理-10]：软硬件项目管理 - 项目质量管理（质量）

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址目录第10章项目质量管理 10 1 基本概念 10 1 1 概述 10 1 2 项目的质量要求 10 1 3 项目质量的主要内容 10
ch1 密码学C/C++库介绍、C中大数的表示、接口语义

Ch1 密码学C C 库介绍话休絮烦既然开了新坑密码学C C 语言实现就直接开始吧这本书的作者是迈克尔威尔森巴赫 Michael Welschenbach 是书籍的第二版本书中描述的软件包名称为FLINT C 意思是数论和密
JAVA直接量

int a 2 char b f 类似以上的2 f 等为直接量直接量可以是8种基本数据类型也可以是null 但null只能复制给引用变量
机器学习线性回归算法实验报告_机器学习——线性回归及kNN算法(作业)

机器学习简介人工智能AI 机器学习与深度学习来自贪心学院课堂PPT 它们都是一种科学研究方法宗旨即辅助人进行决策减少人的不必要劳动时间机器学习训练模型决策判别训练模型前提选择已知的模型如 LR kNN DT SVM M
机器学习——交叉验证（留一法、自助法）

文章目录交叉验证的作用留一法自助法交叉验证的作用很多时候我们都在纠结交叉验证法到底有啥用我不用这个咋的交叉验证是一种模型验证技术可用于评估统计分析模型结果在其它独立数据集上的泛化能力它主要用于预测我们可以用它来评估

机器学习——交叉验证（留一法、自助法）

文章目录

交叉验证的作用

留一法

自助法

机器学习——交叉验证（留一法、自助法） 的相关文章

随机推荐

热门标签

机器学习——交叉验证（留一法、自助法）的相关文章