【ML】对数据处理的几种方法

2023-11-09

数据处理的几种方式:

1、All in
2、Backward Elimination (后退梯度)
3、Forward Elimination (前进梯度)
4、Bidirectional Elimination (比较梯度)
5、Score Comparison

===============================

All in

All in 是把所有的数据都扔进去。无脑。不推荐使用。

Backward Elimination

Backward Elimination可以理解为一步一步抽掉无用的数据。(N -> A)
用所有的数据做出一个模型,留下p values > 5%的变量。
也就是留下影响比较大的数,影响越大,二者之间就越有某种关系。
然后再进行一次运算,再次留下影响大的数。如此循环。

Forward Elimination

Forward Elimination 可以理解为一步一步测试,如果精确度上升
了,那么就加入 (A -> N)

用所有的数据做出一个模型,导入其他特征数据,看看精确度是否提高。
如果有提高就加入,没有提高就不加入。然互就接着导入其他特征数据。

Bidirectional Elimination

Bidirectional Elimination 通过循环比较,交叉比对的方法得到有关联的特征。

举个例子吧:

原来只有A和B做项目。后来来了C,发现工作效率A+B+C > A+B,说明这个人是有效率的。这个到底有多大的效率呢。
然后我们对比如果发现A+C > A+ B 并且 B+C > A+C,说明,加入这个C,是有确实的效率的。这个员工值得拥有。

Score Comparison

Score Comparison 这个是建立在庞大的模型数量下进行。

是把拿到的各种模型来进行模型之间的比较。

最少需要用到1023个model!!!

而前面几种都是建立在庞大的有效数据的前提下运行。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【ML】对数据处理的几种方法 的相关文章

  • 2016物联网版图:物联网奇点是否已经来临?

    物联网是世界上最让人觉得疑惑的科技趋势吗 一方面 我们了解到它将要成为史诗般的存在 并且所有的预言都说它将带来数百亿互联的设备 创造多达万亿美元的经济价值 但是 在另外一方面 终端用户呈现出的主要感觉是 无聊 现在的IoT感觉就是新互联产品
  • linux之间文件传输(转)

    linux的scp命令 linux 的 scp 命令 可以 在 linux 之间复制 文件 和 目录 scp 命令 scp 可以在 2个 linux 主机间复制文件 命令基本格式 scp 可选参数 file source file targ
  • linux下mysql创建数据库注意

    1 create database a b 为Esc键下面那个键
  • 接口测试用例设计

    接口测试用例设计一 1 接口测试概念 接口测试 测试系统间接口的一种测试 测试的对象主要是接口 主要是测试外部系统与所测系统之间以及内部系统之间的交互点 2 接口测试方法 a 可以通过开发脚本代码进行测试 b 可以通过开源免费的接口调用调试

随机推荐

  • ViewPager2 + Fragment(同一个Fragment)ToolBar显示异常

    一个需求 实现Viewpager2 Fragment实现数据的展示 Viewpager外层不是Activity 而是Fragment 详细说明 在一个Viewpager下 使用的是同一个Fragment 由于每一个Fragment显示的数据
  • 数据结构 —— 顺序表的结构、功能(增删查改)。

    一 概念及结构 顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构 一般情况下采用数据存储 在数组上完成数据的增删查改 顺序表的数据必须从第一个位置开始 连续存储的 顺序表一般可以分为 1 1 静态顺序表 使用定长数组存储元素
  • 苹果笔记本学计算机二级方便吗,你是否真的需要MacBook?

    你们好 这里是Sweekli 为你寻找苹果最新资讯 苹果隐藏技巧 苹果良心APP以及苹果优质配件 如果你需要这些 不妨点个关注 目前 主流的电脑操作系统可能有Windows Mac OS Linux和Chrome OS等 但普通用户在选购时
  • Java的前景如何,好不好自学?

    作为一名拥有十年编程经验的老鸟 我觉得还是很有资格来回答这个问题的 毕竟刚下飞机 首先来回答 Java 的前景如何 在我眼里 Java 绝对是世界第一编程语言啊 PHP 表示不服 那也没办法啊 来看 TIOBE 这个编程语言排行榜吧 上面这
  • java proxy 转包

    java proxy 转包 package org rx socks proxy import io netty channel Channel import io netty channel ChannelFuture import io
  • Spring注解@Lazy

    Spring注解 Lazy 一 Lazy注解 1 Lazy注解作用 lazy 翻译过来是 懒惰的 Lazy 懒加载 该注解用于惰性加载初始化标注的类 方法和参数 在Spring中常用于单实例Bean对象的创建和使用 单实例Bean懒加载 容
  • c编译时的错误:程序中有游离的‘\240’‘\302’‘\XXX 时解决方案

    偶尔从网上看到不错的源码 想研究下 不幸编译时遇到 错误 程序中有游离的 240 302 之类的错误 大量的源码不可能再全部重敲一遍 经过一番研究 终于让我找到简单的解决方案 还是本着让后人少走弯路的想法 分享下 首先 编译器提示的 xxx
  • 给本科实验室的分享PPT-21.7.23

    谢邀 讨论一些学习 兴趣和人生 该分享主要面向实验室的大一 大二同学 时间 2021 7 23
  • Arthas 是Alibaba开源的Java诊断工具

    Arthas 是Alibaba开源的Java诊断工具 深受开发者喜爱 当你遇到以下类似问题而束手无策时 Arthas可以帮助你解决 这个类从哪个 jar 包加载的 为什么会报各种类相关的 Exception 我改的代码为什么没有执行到 难道
  • Linux FB 的学习

    linux FB 是CPU 到显示器中的中间人 像一个池子一样 CPU 将操作好的数据项放到池子中 然后再将这些数据显示到屏幕上 它的好处在于 用户可以将FB看成一个显示内存的映射 当将其映射到用户进程空间是可以直接进行读写操作 操作的方式
  • 无尽神域服务器维护,关于对无尽神域的感受亲爱的无尽神域开发团队:

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 关于对无尽神域的感受 亲爱的无尽神域开发团队 你们好 我是一位无尽神域的普通玩家 首先感谢你们能开发出这么一款我个人认为的优质游戏 从公测到现在玩的这十几天了 好的体验有很多 也有些希望开发团队
  • 我从未结束的Java之旅

    目录 开篇 毕业 第一份工作的结束 大胆北漂 第一次在北京租房 供应链 新的开始 好景不长 餐饮 误打误撞 线上事故 事故原因 复盘 开篇 简单的做个自我介绍 码龄九年 主要从事java开发 对前端和python略有了解 是一个技术不精湛但
  • C#位运算相关知识梳理

    位和字节的介绍 位 b 也叫比特位 是计算机数据最小的单位 用二进制0和1来存储 字节 byte 1 byte 8 b 一个字节 8位 字符 char 1 char 2byte 16b 1个字符 2 个字节 16位 KB 1KB 1024b
  • 最新信息安全毕设选题题目推荐

    0 简介 毕业季马上就要开始了 不少同学询问学长网安专业选题以及开题相关的问题 今天跟大家分享信息安全毕设选题 最新的信息安全 网络安全 专业毕设选题 难度适中 适合作为毕业设计 大家参考 学长整理的题目标准 相对容易 工作量达标 题目新颖
  • linux视频教程

    这15 张光盘最为值得推荐的是国嵌的视频教程 其中的一些wince资料以及中嵌的视频教程也比较适合初学者 国嵌视频教程由嵌入式Linux专业培训机构成都国嵌公司免费提供的4个培训班完整最新视频 总共包含4张DVD光盘 76个视频文件 总时长
  • VC++6.0的兼容性问题解决方案

    VC6 0 能够在 XP 下很好的运行 无需进行额外的设置 但在 Win7 Win8 和 Win10 下 安装完成后还要修改兼容模式才可以 在Win7或Win10下使用VC6 0 对于Win7和Win10 需要将VC6 0的兼容模式修改为
  • Jupyter Notebook查看文件

    Jupyter Notebook查看文件 打开dos 输入Jupyter Notebook 打开dos 切换到ipynb文件所在路径下 输入Jupyter Notebook Jupyter Notebook 看到图片都丢失了 返回上一级的目
  • WSL——Kali子系统安装及其相关配置

    Kali子系统安装及其相关配置 一 WSL简介 二 开启WSL功能 三 安装kali子系统 四 安装Windows Terminal 五 对Kali的设置 1 更换更新源 2 安装完整版Kali 六 配置图形化桌面并连接 1 下载 X410
  • mac下编译安装php7.4.5及相关扩展安装

    php7 4 5下载地址 https www php net distributions php 7 4 5 tar gz MAC版本 macOS catalina 10 15 4 编译参数 configure prefix Users m
  • 【ML】对数据处理的几种方法

    数据处理的几种方式 1 All in 2 Backward Elimination 后退梯度 3 Forward Elimination 前进梯度 4 Bidirectional Elimination 比较梯度 5 Score Compa