使用学习曲线(Learning curve)，判断机器学习模型过拟合、欠拟合，与解决过拟合、欠拟合的问题

2023-10-26

文章目录

1.基本概念
- 过拟合与欠拟合
- 根据学习曲线判断过拟合、欠拟合
2.示例代码：绘制学习曲线
3.解决过拟合、欠拟合
- 解决过拟合
- 解决欠拟合
4. 过拟合、欠拟合的深层理解

1.基本概念

过拟合与欠拟合

过拟合（学成书呆子了）：指模型在训练集上表现优秀，在测试集上表现很差
欠拟合（还没学明白）：指模型难以学习已有的规律，在训练集和测试集上表现得都很差；或是模型过早的停止训练

根据学习曲线判断过拟合、欠拟合

在实际的使用过程中，过拟合、欠拟合是一个较为主观的评价，没有一个指标能拍板说它就是过拟合了、或就是欠拟合了。而且，过拟合与欠拟合实际上并不是相对的概念，即并未非此即彼，往往：

模型效果太差：欠拟合
模型在训练集上还可以，但测试集上太差：过拟合
模型训练集和测试集都还行：不存在过拟合与欠拟合

下面是一个例子：
在这里插入图片描述
上图是一个比较经典的示意图：

左上角：我们看到随着训练数据的增加（随着x不断增加），准确率趋于稳定，意味着：再添加更多数据，已经无法使模型更好了，说明模型已经到极限了，这就是正常的。但是此时模型的准确率也太低了，如果我们的预期是红色的线，说明模型已经尽力了，也无法达到我们的预测，此时它就是欠拟合的。
右上角：我们看到训练的曲线与验证的曲线相差加大（两条线离的有点远），即：在训练集上效果还行（绿色虚线比较高），但验证集上效果不行（蓝色实线），此时为过拟合
右下角：完美，既不存在过拟合也不存在欠拟合

2.示例代码：绘制学习曲线

import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVC
from sklearn.model_selection import learning_curve
import seaborn as sns
from sklearn.datasets import make_classification


def main():
    data_x, data_y = make_classification(n_samples=1000, n_classes=4, n_features=10, n_informative=8)  # 生成分类任务
    # 绘制学习曲线
    model = SVC(kernel="linear")
    train_sizes, train_scores, valid_scores = learning_curve(
        model, data_x, data_y, train_sizes=np.linspace(0.1, 1.0, 10), cv=5, random_state=0)
    train_scores_mean = np.mean(train_scores, axis=1)  # 纵向求平均
    valid_scores_mean = np.mean(valid_scores, axis=1)
    # 开始绘图
    sns.set()
    sns.lineplot(x=train_sizes, y=train_scores_mean, label="train")
    sns.lineplot(x=train_sizes, y=valid_scores_mean, label="valid")
    plt.xlabel("data")
    plt.ylabel("acc")
    plt.title("SVM linear")
    plt.show()


if __name__ == '__main__':
    main()

得到结果：
在这里插入图片描述

3.解决过拟合、欠拟合

我们可以参考这个图
在这里插入图片描述

解决过拟合

核心：降低模型复杂度，或增加数据的复杂程度

降低模型复杂度
L1\L2\Dropout 正则化（这里Dropout是深度学习中的方法：随机将一些连接置零）
Early stopping （提前终止）
通过数据增强处理数据

解决欠拟合

欠拟合基本上都会发生在训练刚开始的时候，因此解决欠拟合的核心是：增加模型复杂度，或降低数据的学习难度

增加模型复杂度
增加数据量
增加特征

4. 过拟合、欠拟合的深层理解

评价模型的指标，就是在已有的数据上平衡两种东西：表现出偏差与方差

简单的模型拥有测试集上更大的偏差，但由于整体不复杂，因此偏差的方差较小，某种程度上称欠拟合；
复杂的模型拥有测试集上更小的偏差，但由于较为复杂，因此偏差的方差较大，称过拟合；

如果是较大的偏差较大的方差，则说明模型废了；较小的偏差与较小的方差是我们努力的方向！
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

使用学习曲线(Learning curve)，判断机器学习模型过拟合、欠拟合，与解决过拟合、欠拟合的问题的相关文章

Java系列——封装、继承、多态初了解

目录一前言二封装 1 什么是封装 2 封装的特点 3 封装的使用三继承 1 什么是继承 2 继承的特点 3 继承的优点 4 继承的使用 4 1 继承的格式 4 2 继承的演示 4 3 成员变量 4 4 成员方法 4 5 构造方法
Pyhton零售数据分析及产品关联分析

一项目背景总结项目背景以购物篮分析为背景分析某跨国棒球用品零售商的历史订单数据为企业提供运营及销售策略项目总结一本项目对企业历史订单数据进行以下角度的处理及分析数据探索及清洗对6w 订单数据进行探索及清洗处理为数据构
2022年最新前端面试题，持续更新

js面试题 1 js数据类型基本数据类型 Number String Boolean Null Undefined Symbol bigInt 引用数据类型 object Array Date Function RegExp 2 js变量
surf特征原理

前言也许我们使用过Uiautomator编写过自动化测试脚本也许我们也使用过Monkey来测试过应用的稳定性但在使用过程中总觉得有或多或小的问题用Uiautomator写脚本总觉得有时候控件没法识别用Monkey来进行稳定性测试
Oracle SQL developer不显示dbms_output.put_line的输出内容

1 调出dbms输出窗口 2 dbms选择对应的数据库连接 3 工作区SQL文件定义一个触发器 create trigger newtmpdata 创建触发器newtmpdata 在tmp中添加新数据 after insert 插入操作之

随机推荐

yolo算法通俗易懂讲解

参考 https blog csdn net briblue article details 103149407 depth 1 utm source distribute pc relevant none task utm source
.NET[C#]LINQ查询List集合中所有重复的元素如何实现？(转载)

NET C LINQ查询List集合中所有重复的元素如何实现转载方案一 var query lst GroupBy x gt x Where g gt g Count gt 1 Select y gt y Key ToList 如果还需
C#，去除字符串指定的之字符，并去掉不可见的 “”一种方法。

string str1 小王心情很平静 char chs1 new char 定义一个字符数组存放上面字符串中不要的内容和 string result1 str1 Split chs1 StringSplitOptions Re
关于Adapter数据适配器

适配器什么是适配器 Android适配器是数据和视图之间的桥梁以便于数据在View上显示适配器就像显示器把复杂的东西按人可以接受的方式来展现 Adapter数据适配器将各种数据以合适的形式绑定到控件上像listview gridv
MyBatis框架——MyBatis执行SQL的两种方式（转载）

本节主要介绍 MyBatis 执行 SQL 语句的两种方式和它们的区别 MyBatis 有两种执行 SQL 语句的方式如下通过 SqlSession 发送 SQL 通过 SqlSession 获取 Mapper 接口通过 Mapper
ajax 无参请求,ajax无参请求学习

ajax 点击请求流程 test html代码流程创建button按钮为button绑定一个点击事件函数在函数内书写ajax代码 2 1 创建ajax对象 2 2 设置onreadystatechange属性用来监听变化如果有
数据结构视频教程 -《数据结构视频教程严蔚敏》

整个视频打包下载地址史上最全的数据结构视频教程系列分享之数据结构视频教程严蔚敏转载请保留出处和链接更多优秀资源请访问我是码农严蔚敏老师是清华大学计算机系教授长期从事数据结构教学和教材建设本教程是数据结构视频教程中的经典之作
Spring（十二）：bean的加载——创建bean

回顾前面已经看了在加载Bean的时候如何去解决循环依赖的问题解决完循环依赖就到创建Bean的步骤了而创建bean的步骤是紧紧接着创建Bean实例 Bean根据范围会分为几种单例原型自定义范围每种范围都会有自己不同的生命周
【Altium designer】PCB 各层简介

1 Signal Layer 信号层主要用于放置元件和走线 Top Layer 顶层 Bottom Layer 底层 Mid Layer 中间信号层 2 Mechanical Layer 机械层 3 Keep Out Layer 禁止布线
Linux内核：内存管理——内存回收

概述当linux系统内存压力就大时就会对系统的每个压力大的zone进程内存回收内存回收主要是针对匿名页和文件页进行的对于匿名页内存回收过程中会筛选出一些不经常使用的匿名页将它们写入到swap分区中然后作为空闲页框释放到伙伴系统
c++学习之多态案例--电脑组装

代码示例 include
Mysql事务隔离级别与锁机制

文章目录事务及其ACID属性并发事务处理带来的问题隔离级别锁表锁测试行锁测试仅限innodb 幻读测试可重复读和java代码之间的问题间隙锁 Gap Lock 和临键锁 Next key Locks 意向锁表级别的锁
linetime.css,时间线图绘制（time-line）

效果 image png vue 单文件组件 v startTime substring 10 16 v startTime substring 5 10 v name v state v startTime export default
pandas将一列分割成多列

示例数据 import pandas as pd from pandas import Series DataFrame consum pd read csv consum csv encoding ANSI consum 消费时间要将
学习pytorch: 深度学习入门建议

0 简介本文主要介绍了使用pytorch作为框架入门深度学习其中第1节深度学习入门内容较多建议边看第1节边实践第2节 Pytorch入门中的内容主要是2 1和2 2 1 深度学习入门网上的资源非常多这里重点推荐一个资源斯
如何下载MySQL的JDBC驱动包

1 打开 MySQL 官网 https www mysql com 2 点击 DOWNLOADS 把页面滚动到最下面点击 MySQL Community GPL Downloads 3 点击 Connector J 4 点击 Genera
dvajs 中实现首页导航路由嵌套（利用dvajs创建前端页面）

react router3 0 升级为react router4 0后不再支持多个
VMware vCenter服务器常用的巡检命令、运维命令和PowerShell脚本

一前言最近整理一些VMware vCenter和Esxi常用的巡检命令和运维命令如下二巡检命令 vc support pl 用于vCenter服务器日志收集的perl脚本收集vCenter相关的debug日志和配置信息方便VMw
数据库技术内幕

2019独角兽企业重金招聘Python工程师标准 gt gt gt 处理百万级以上的数据提高查询速度的方法 1 应尽量避免在 where 子句中使用或 lt gt 操作符否则将引擎放弃使用索引而进行全表扫描 2 对查询进行优化应尽量避
使用学习曲线(Learning curve)，判断机器学习模型过拟合、欠拟合，与解决过拟合、欠拟合的问题

文章目录 1 基本概念过拟合与欠拟合根据学习曲线判断过拟合欠拟合 2 示例代码绘制学习曲线 3 解决过拟合欠拟合解决过拟合解决欠拟合 4 过拟合欠拟合的深层理解 1 基本概念过拟合与欠拟合过拟合学成书呆子了指模型在训