人工智能——机器学习，数据特征预处理，数据降维

2023-10-29

数据特征预处理，数据降维

处理方法： 1，数值型数据：标准缩放（1）归一化

（2）标准化

（3）缺失值

2，类别型数据： one-hot 编码

3，时间类型：时间的切分

下面是归一化，标准化，缺失值，（这是小编的笔记）

归一化：通过对原始数据进行转换，把数据映射到，0，1之间。（其实就是把复杂的数据通过公式算法变成简单的0~1之间。）

标准化：通过对原始数据进行转换，把数据转换成均值为0，方差为1的范围。（方差考量数据的稳定数据的稳定性，如果方差为零，表示数据的值是一样的）

#导入包

from sklearn.preprocessingimport StandardScaler

import numpyas np

from sklearn.imputeimport SimpleImputer

def sdandar():

"""

标准化处理

:return: None

"""

#实例化

bzh = StandardScaler()

data = bzh.fit_transform([[1,-1,3],[2,4,2],[4,6,-1]])

print(data)

return None

def inputer():

"""

标准化处理

:return: None

"""

#实例化

qsz = SimpleImputer(strategy='mean')

data = qsz.fit_transform([[1,-1,3],[np.nan,4,2],[4,6,-1]])

print(data)

return None

if __name__ =="__main__":

inputer()

数据的降维：（改变特征的数量）

特征选择的原因：冗余——部分特征的相关度高，容易消耗计算机性能

噪声——部分特征对与预测结果有影响

特征选择的主要方法：Filter过滤式，Embedded嵌入式，Wrapper包裹式

PCA：本质——PCA是一种分析，简化数据集的技术

目的——是数据维数压缩，尽可能降低数据的维数，这样会损失少量的信息

作用——可以削减回归分析或聚类分析中的特征数量

简而言之：小编的理解是，数据特征预处理和降维的核心是提炼数据，去除水分，提高计算机性能的利用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

机器学习

数据挖掘

神经网络

人工智能——机器学习，数据特征预处理，数据降维的相关文章

Postman导出接口

导出的文件
Enterprise Architect（EA）画UML之用例图，敲详细讲解+实战举例

目录具体步骤前提准备实战画用例图实战加一绘制机票预订系统用例图补充补充一如何调整整体字体补充二如何修改边框字体补充三在关闭Enterprise Architect之后如何打开在 UML面向对象分析建模与设计
ReactNative 学习笔记

学习使用的开发工具编译器 VSCode 开发语言工具 TypeScript 重要程度分类一般这个程度的知识点主要是达到熟练掌握即可不用太深入研究和学习重要这个程度的知识点主要是达到熟练掌握并且内部的原理切要熟记因为会关联到其

随机推荐

【大数问题】字符串相减（大数相减）＜模拟＞

类似力扣 415 字符串相加大数相加实现大数相减题解模拟相减的过程先一直使大数减小数记录借位最后再判断是否加负号中间需要删除前导0 例如10001 10000 00001 import java util public c
java byte格式_Java——详解java中的byte类型

Java也提供了一个byte数据类型并且是基本类型 java byte是做为最小的数字来处理的因此它的值域被定义为 128 127 也就是signed byte 下面这篇文章主要给大家介绍了关于java中byte类型的相关资料需要的朋
基于粒子群算法(PSO)优化径向基神经网络(PSO-RBF)的数据回归预测，多变量输入模型。matlab代码，优化参数为扩散速度，采用交叉验证。评价指标包括:R2、MAE、MSE、RMSE和M

clc clear all close all tic warning off 导入数据训练集 190个样本 P train xlsread data training set B2 G191 T train xlsread data t
解决Antd Tree组件，二次点击时不取消选中，保持高亮

一问题概述 ant design 提供的 Tree树组件支持点击高亮树节点再次点击取消高亮默认效果如下然而大多数业务场景下我们希望多次点击同一个节点不会取消他的选中效果二解决方案监听onSelect时间并使用select
BUG解决Button类不能从UnityEngine.UI中引用

Button does not contain a definition for onClick and no accessible extension method onClick accepting a first argument o
mysql 分表插入,mysql实现插入数据到分表

创建原始数据表 DROP TABLE IF EXISTS articleinfo CREATE TABLE articleinfo id BIGINT UNSIGNED NOT NULL AUTO INCREMENT PRIMARY KEY
suse11/12下关闭防火墙

service SuSEfirewall2 init stop chkconfig SuSEfirewall2 init off 启动操作为 service SuSEfirewall2 setup start service SuSEfir
通过java解析域名获得IP地址

IP地址是Internet主机的作为路由寻址用的数字型标识人不容易记忆因而产生了域名 domain name 这一种字符型标识 DNS即为域名解析服务在这里我们如果想通过java程序来解析域名获得真实IP的话可以通过java的Ine
C语言指针高级篇

相信很多人都听过指针是c语言的灵魂对于指针的学习往往也是最难的也是最难搞懂的那么今天我们一起来学习分析c语言的指针体会c语言的魅力指针和指针应用大概分为一下几类 1 字符指针 2 数组指针 3 指针数组 4 数组传参和指针传参
Node.js笔记-day04

18 Node js 回调函数 Node js 异步编程的直接体现就是回调异步编程依托于回调来实现但不能说使用了回调后程序就异步化了回调函数在完成任务后就会被调用 Node 使用了大量的回调函数 Node 所有 API 都支持回调函数
Linux关于文件或者目录的常见命令

1 查看当前所在目录 print working directory 该命令的基本格式为 root localhost pwd 2 查看指定目录下所有的子目录或者文件列表 list 该命令的基本格式为 root localhost ls 选
Axios（万字详细教程）

Axios介绍 1 Axios是什么 Axios是一个基于promise的HTTP库类似于jQuery的ajax 用于http请求可以应用于浏览器端和node js 既可以用于客户端也可以用于node js编写的服务端 2 Axios
idea项目无法打包

打包过程点击maven 点击lifecycle后点击package 运行后出现打包出错原因是plugins标签里面缺少maven resources plugin依赖需要在pom xml里面添加依赖
Zimg—轻量级图片服务器搭建利器

在一个互联网应用中图片扮演着越来越重要的角色有稳定的可扩展的图片存储服务器就显得尤为的重要云厂商们提供了便利的图片存储服务花钱就可以解决了这里简单介绍一个开源的一个分布式图片存储服务器 zimg 来自己搭建一个图片服务器当然你也
2022阿里巴巴全球数学竞赛第4题虎虎生威（盲盒问题、集卡问题）解决思路

目录题目基础概念数学期望题解虎生威问题水浒传108卡问题虎虎生威问题题目来自 2022阿里巴巴全球数学竞赛第4题单选题基础概念数学期望在概率论和统计学中数学期望 mathematic expectatio
机器学习好伙伴之scikit-learn的使用——特征提取

机器学习好伙伴之scikit learn的使用特征提取什么是特征提取 sklearn中特征提取的实现 PCA 主成分分析 LDA 线性评价分析应用示例 PCA部分 LDA部分有些时候特征太多了可以利用sklearn中自带的函数进行
Yii Framework 开发教程(48) 多国语言示例

本例通过Yii Framework 开发教程 11 UI 组件 ActiveForm示例添加中文支持简要说明一下多国语言支持详细文档可可以参考Yii文档信息翻译是通过调用 Yii t 实现的此方法会将信息从源语言翻译为目标语言
DVWA学习之XSS（跨站脚本攻击）（超级详细）

DVWA学习之XSS XSS 跨站脚本攻击 0x01 XSS Cross Site Script 简介 0x02 何为XSS 0x03 XSS存在的原因 0x04 XSS漏洞的危害 0x05 XSS 的分类及特点 1 存储型XSS 2 反射
初识C语言（3）

目录 8 函数函数的特点就是简化代码代码复用 9 数组要存储 1 10 的数字怎么存储 C 语言中给了数组的定义一组相同类型元素的集合 9 1数组的定义 9 2数组的下标 C 语言规定数组的每个元素都有一个下标下标是从 0 开
人工智能——机器学习，数据特征预处理，数据降维

数据特征预处理数据降维处理方法 1 数值型数据标准缩放 1 归一化 2 标准化 3 缺失值 2 类别型数据 one hot 编码 3 时间类型时间的切分下面是归一

人工智能——机器学习，数据特征预处理，数据降维

人工智能——机器学习，数据特征预处理，数据降维 的相关文章

随机推荐

热门标签

人工智能——机器学习，数据特征预处理，数据降维的相关文章