cvday14--模型训练过程

2023-11-02

 

  模型训练的过程其实就是在求【参数】的过程,我们先假定某类【模型】(比如决策树模型),然后用【训练集】来训练,学习到对应的最优的【参数】。但是问题在于,我们没有办法保证我们假设的那个【模型】是最优的,我们极有可能假设错误对吧。那怎么办呢?有一个简单的解决方案就是我们假设一堆的模型,然后用【训练集】分别对这些模型来进行训练,学习到每一个【模型】中分别对应的参数——这是第一步,也就是【训练集】的任务。

那么我们已经学习到了一堆的模型了,哪一个模型是最好的呢?这其实就是要来考察不同结构的模型在这些data上的优劣程度了。通常来说,我们用【超参数】来控制模型的结构(例如正则项系数、神经网络中隐层的节点个数,k值等)。那这个时候,我们就可以找一些数据来训练和学习我们具体的超参数了。用什么样的数据呢?直接用【训练集】肯定是不行的,因为我们现在的每一个模型都是用【训练集】来学习出来的,他们在【训练集】上的效果已经很好了,继续用它们来训练超参数不会有太大的效果,所以说我们就选择了使用【验证集】来选择这些超参数。这是第二步,也就是【验证集】的任务,我们也通常称之为【调参】。

最后,当我们学习到了【参数】和【非参数】后,我们就确定了我们具体的模型结构,这个时候我们再用一些数据来测试这个模型在新的数据上的效果。因此,我们就不能够使用之前已经使用过的数据了,而要选择一个全新的数据集,这既是【测试集】。这个时候我们就要来看最后的结果怎么样,如果结果很好,那么说明一切顺利,但是如果结果很差,那问题出在哪里呢?其中可能的一个原因就是我们事先假定的那一类的【模型】(比如我们最先选择的决策树模型)并不是适合来分析这些数据,因此哪怕我们选择出了这一堆决策树模型中最好的一个(超参数的选择过程),它的效果依旧不怎么样。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

cvday14--模型训练过程 的相关文章

随机推荐

  • 精确时钟同步协议ptp/IEEE-1588v2协议-------(2)主从时钟之间的消息交互与时钟同步过程

    本文目录 1 主时钟和从时钟之间的消息交互流 2 延时delay和偏移offset的计算 2 1 延时delay的计算 2 2 偏移offset的计算 主时钟和从时钟之间 通过sync follow up delay request del
  • [黑盾杯]2020之Misc篇刷题记录(16)

    黑盾杯 2020之Misc篇刷题记录 16 黑盾杯 2020 encrypt 黑盾杯 2020 Blue 黑盾杯 2020 blind 黑盾杯 2020 Trees UTCTF 2020 Spectre UTCTF 2020 Observe
  • (四)SQL

    本篇介绍SQL的数据库定义语言DDL 主要有数据库的增删改用 表的增删改查 并且配套有MySQL实操练习 01 数据库的增删查用 1 1 基本语法 查询数据库 SHOW DATABASES 查询所有数据库 SELECT DATABASE 查
  • matlab折线图折点加数值

    1 只显示y轴数值 x 0 8 acc 100 100 100 100 100 99 9 97 45 73 95 39 59 plot x acc LineWidth 1 5 xlabel 噪声等级 FontSize 16 ylabel 聚
  • cmd输出彩色字体(win10 cmd控制台支持ANSI转义序列)

    这是啥 ANSI转义序列是一种带内信号的转义序列标准 用于控制视频文本终端上的光标位置 颜色和其他选项 在文本中嵌入确定的字节序列 大部分以ESC转义字符和 字符开始 终端会把这些字节序列解释为相应的指令 而不是普通的字符编码 ANSI序列
  • CSDN-markdown编辑器使用详细

    这里写自定义目录标题 欢迎使用Markdown编辑器 新的改变 功能快捷键 合理的创建标题 有助于目录的生成 如何改变文本的样式 插入链接与图片 如何插入一段漂亮的代码片 生成一个适合你的列表 创建一个表格 设定内容居中 居左 居右 Sma
  • 网易2018校招编程题集合4

    小易有一个长度为n的整数序列 a 1 a n 然后考虑在一个空序列b上进行n次以下操作 1 将a i放入b序列的末尾 2 逆置b序列 小易需要你计算输出操作n次之后的b序列
  • 登录Windows自动映射磁盘

    最近项目客户要求做一个功能 内容是希望希望用户在登录windows的时候 根据用户自己负责的项目来自动创建网络映射驱动器 用户需要映射磁盘的信息都存在数据库中 经过调查研究 打算使用powershell实现 实现方式大体如下 1 先创建po
  • 一次性解决打日志时的4个重复低效场景(日志脱敏、日期格式化、json序列化)...

    关注公众号 1024个为什么 及时接收最新推送文章 本篇文章是对之前的两篇文章的一个总结 补充 日志里打出来的都是时间戳 教你一行代码搞定它https blog csdn net JiuQianWan article details 127
  • apt-get install

    apt get可以用于运作deb包 例如在Ubuntu系统上对某个软件的管理 安装 apt get install
  • 酒桌上的你是什么样

    好久没写博客了 人是越待着越懒 最近刚刚培养起自己学习的兴趣 上网看看 看到一个关于酒桌的学问 拿来借鉴下 以后用得着啊 第一原则 如果自己不能喝 丫就别开始第一口 自己端着饭碗夹了菜一边吃着去 第二原则 如果确信自己要喝 就别装墨迹 接下
  • uniApp 使用Vuex 出现 Cannot read properties of undefined (reading ‘commit‘)情况

    最近下手uni app 尝鲜 想到vue全家桶的使用 vuex是必不可少的 使用实例使用完按照文档方法使用 发现了一个问题 在调用vue自定义的commit函数是会报错 Cannot read properties of undefined
  • 【计算机视觉

    文章目录 一 前言 二 可以获得什么 三 入门实践 3 1 帮助文档 3 2 安装 3 3 模型的组成 3 4 BERT模型的使用 3 4 1 导入模型 3 4 2 使用模型 3 4 2 1 tokenizer 3 5 model 3 6
  • MySQL读取Binlog日志常见的3种错误

    1 mysqlbinlog ERROR unknown variable default character set utf8mb4 当我们在my cnf中添加default character set utf8mb4选项 那么在mysql
  • Unity 开发总结之VLC Player for Unity插件的使用

    Unity项目开发过程中 视频播放这块是避免不了的重要组成部分 网上也有很多资料做了详细的介绍 但基本都是基于Unity的MovieTexture对象 即要求视频源必须是导入的本地视频文件 如果视频源变为在线视频流如RTSP之类的形式呢 显
  • 全球金融科技百强,神州信息连续两年位列中国上榜企业第一名!

    美国时间10月13日 IDC全球Financial Insights发布2020年全球金融科技大奖 FinTech Rankings百强榜单 神州信息作为金融科技全产业链综合服务商 位列榜单第39位 是百强榜单中排名第一的中国企业 这也是神
  • 关于calloc函数,malloc函数的理解(概念+例题讲解)

    文章目录 引入 calloc函数和malloc函数 两者区别 我的问题 问题解决 总结 引入 我们在牛客网或者 leetcode刷题时经常遇到让你写核心代码的做题模式 作为一个刚开始刷题不久的新人 我在没有学习calloc函数时 遇到了需要
  • 吴恩达 04.卷积神经网络 第一周作业Convolutional Neural Networks: Application

    Convolutional Neural Networks Application Welcome to Course 4 s second assignment In this notebook you will Implement he
  • STM32串口DMA接收数据错位——暴力解决方法

    背景 两片STM32通过串口通信 为了减小CPU负担 采用DMA进行通信 发送端为STM32F103C8T6 接收端为STM32F407VET6 在调试的过程中发现 一直出现数据错位的问题 接收端尝试了串口空闲中断和串口DMA传输完成中断
  • cvday14--模型训练过程

    模型训练的过程其实就是在求 参数 的过程 我们先假定某类 模型 比如决策树模型 然后用 训练集 来训练 学习到对应的最优的 参数 但是问题在于 我们没有办法保证我们假设的那个 模型 是最优的 我们极有可能假设错误对吧 那怎么办呢 有一个简单