【ML】对数据处理的几种方法

2023-11-09

数据处理的几种方式：

1、All in
2、Backward Elimination (后退梯度)
3、Forward Elimination (前进梯度)
4、Bidirectional Elimination （比较梯度）
5、Score Comparison

===============================

All in

All in 是把所有的数据都扔进去。无脑。不推荐使用。

Backward Elimination

Backward Elimination可以理解为一步一步抽掉无用的数据。（N -> A）
用所有的数据做出一个模型，留下p values > 5%的变量。
也就是留下影响比较大的数，影响越大，二者之间就越有某种关系。
然后再进行一次运算，再次留下影响大的数。如此循环。

Forward Elimination

Forward Elimination 可以理解为一步一步测试，如果精确度上升
了，那么就加入（A -> N）

用所有的数据做出一个模型，导入其他特征数据，看看精确度是否提高。
如果有提高就加入，没有提高就不加入。然互就接着导入其他特征数据。

Bidirectional Elimination

Bidirectional Elimination 通过循环比较，交叉比对的方法得到有关联的特征。

举个例子吧：

原来只有A和B做项目。后来来了C，发现工作效率A+B+C > A+B，说明这个人是有效率的。这个到底有多大的效率呢。
然后我们对比如果发现A+C > A+ B 并且 B+C > A+C，说明，加入这个C，是有确实的效率的。这个员工值得拥有。

Score Comparison

Score Comparison 这个是建立在庞大的模型数量下进行。

是把拿到的各种模型来进行模型之间的比较。

最少需要用到1023个model！！！

而前面几种都是建立在庞大的有效数据的前提下运行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习ML

数据处理

机器学习

【ML】对数据处理的几种方法的相关文章

2016物联网版图：物联网奇点是否已经来临？

物联网是世界上最让人觉得疑惑的科技趋势吗一方面我们了解到它将要成为史诗般的存在并且所有的预言都说它将带来数百亿互联的设备创造多达万亿美元的经济价值但是在另外一方面终端用户呈现出的主要感觉是无聊现在的IoT感觉就是新互联产品
linux之间文件传输(转)

linux的scp命令 linux 的 scp 命令可以在 linux 之间复制文件和目录 scp 命令 scp 可以在 2个 linux 主机间复制文件命令基本格式 scp 可选参数 file source file targ
linux下mysql创建数据库注意

1 create database a b 为Esc键下面那个键
接口测试用例设计

接口测试用例设计一 1 接口测试概念接口测试测试系统间接口的一种测试测试的对象主要是接口主要是测试外部系统与所测系统之间以及内部系统之间的交互点 2 接口测试方法 a 可以通过开发脚本代码进行测试 b 可以通过开源免费的接口调用调试

随机推荐

ViewPager2 + Fragment(同一个Fragment)ToolBar显示异常

一个需求实现Viewpager2 Fragment实现数据的展示 Viewpager外层不是Activity 而是Fragment 详细说明在一个Viewpager下使用的是同一个Fragment 由于每一个Fragment显示的数据
数据结构 —— 顺序表的结构、功能（增删查改）。

一概念及结构顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构一般情况下采用数据存储在数组上完成数据的增删查改顺序表的数据必须从第一个位置开始连续存储的顺序表一般可以分为 1 1 静态顺序表使用定长数组存储元素
苹果笔记本学计算机二级方便吗,你是否真的需要MacBook？

你们好这里是Sweekli 为你寻找苹果最新资讯苹果隐藏技巧苹果良心APP以及苹果优质配件如果你需要这些不妨点个关注目前主流的电脑操作系统可能有Windows Mac OS Linux和Chrome OS等但普通用户在选购时
Java的前景如何，好不好自学？

作为一名拥有十年编程经验的老鸟我觉得还是很有资格来回答这个问题的毕竟刚下飞机首先来回答 Java 的前景如何在我眼里 Java 绝对是世界第一编程语言啊 PHP 表示不服那也没办法啊来看 TIOBE 这个编程语言排行榜吧上面这
java proxy 转包

java proxy 转包 package org rx socks proxy import io netty channel Channel import io netty channel ChannelFuture import io
Spring注解@Lazy

Spring注解 Lazy 一 Lazy注解 1 Lazy注解作用 lazy 翻译过来是懒惰的 Lazy 懒加载该注解用于惰性加载初始化标注的类方法和参数在Spring中常用于单实例Bean对象的创建和使用单实例Bean懒加载容
c编译时的错误：程序中有游离的‘\240’‘\302’‘\XXX 时解决方案

偶尔从网上看到不错的源码想研究下不幸编译时遇到错误程序中有游离的 240 302 之类的错误大量的源码不可能再全部重敲一遍经过一番研究终于让我找到简单的解决方案还是本着让后人少走弯路的想法分享下首先编译器提示的 xxx
给本科实验室的分享PPT-21.7.23

谢邀讨论一些学习兴趣和人生该分享主要面向实验室的大一大二同学时间 2021 7 23
Arthas 是Alibaba开源的Java诊断工具

Arthas 是Alibaba开源的Java诊断工具深受开发者喜爱当你遇到以下类似问题而束手无策时 Arthas可以帮助你解决这个类从哪个 jar 包加载的为什么会报各种类相关的 Exception 我改的代码为什么没有执行到难道
Linux FB 的学习

linux FB 是CPU 到显示器中的中间人像一个池子一样 CPU 将操作好的数据项放到池子中然后再将这些数据显示到屏幕上它的好处在于用户可以将FB看成一个显示内存的映射当将其映射到用户进程空间是可以直接进行读写操作操作的方式
无尽神域服务器维护,关于对无尽神域的感受亲爱的无尽神域开发团队：

该楼层疑似违规已被系统折叠隐藏此楼查看此楼关于对无尽神域的感受亲爱的无尽神域开发团队你们好我是一位无尽神域的普通玩家首先感谢你们能开发出这么一款我个人认为的优质游戏从公测到现在玩的这十几天了好的体验有很多也有些希望开发团队
我从未结束的Java之旅

目录开篇毕业第一份工作的结束大胆北漂第一次在北京租房供应链新的开始好景不长餐饮误打误撞线上事故事故原因复盘开篇简单的做个自我介绍码龄九年主要从事java开发对前端和python略有了解是一个技术不精湛但
C#位运算相关知识梳理

位和字节的介绍位 b 也叫比特位是计算机数据最小的单位用二进制0和1来存储字节 byte 1 byte 8 b 一个字节 8位字符 char 1 char 2byte 16b 1个字符 2 个字节 16位 KB 1KB 1024b
最新信息安全毕设选题题目推荐

0 简介毕业季马上就要开始了不少同学询问学长网安专业选题以及开题相关的问题今天跟大家分享信息安全毕设选题最新的信息安全网络安全专业毕设选题难度适中适合作为毕业设计大家参考学长整理的题目标准相对容易工作量达标题目新颖
linux视频教程

这15 张光盘最为值得推荐的是国嵌的视频教程其中的一些wince资料以及中嵌的视频教程也比较适合初学者国嵌视频教程由嵌入式Linux专业培训机构成都国嵌公司免费提供的4个培训班完整最新视频总共包含4张DVD光盘 76个视频文件总时长
VC++6.0的兼容性问题解决方案

VC6 0 能够在 XP 下很好的运行无需进行额外的设置但在 Win7 Win8 和 Win10 下安装完成后还要修改兼容模式才可以在Win7或Win10下使用VC6 0 对于Win7和Win10 需要将VC6 0的兼容模式修改为
Jupyter Notebook查看文件

Jupyter Notebook查看文件打开dos 输入Jupyter Notebook 打开dos 切换到ipynb文件所在路径下输入Jupyter Notebook Jupyter Notebook 看到图片都丢失了返回上一级的目
WSL——Kali子系统安装及其相关配置

Kali子系统安装及其相关配置一 WSL简介二开启WSL功能三安装kali子系统四安装Windows Terminal 五对Kali的设置 1 更换更新源 2 安装完整版Kali 六配置图形化桌面并连接 1 下载 X410
mac下编译安装php7.4.5及相关扩展安装

php7 4 5下载地址 https www php net distributions php 7 4 5 tar gz MAC版本 macOS catalina 10 15 4 编译参数 configure prefix Users m
【ML】对数据处理的几种方法

数据处理的几种方式 1 All in 2 Backward Elimination 后退梯度 3 Forward Elimination 前进梯度 4 Bidirectional Elimination 比较梯度 5 Score Compa

热门标签