数据分析----数据清洗

2023-05-16

文章目录

  • 前言
  • 一、数据清洗是什么?
  • 二、步骤
    • 1、选择列
    • 2、缺失值处理
      • 1、找到缺失值
      • 2、处理缺失值的方法
    • 3、数据类型转化
    • 4、重复值处理
  • 总结


前言

随着科技的不断发展,数据在我们生活中越来越多,面对繁杂的数据,我们根本无从下手,本文就简单的介绍一下数据分析中的数据清洗。

一、数据清洗是什么?

这是数据分析中最重要的一步,是指发现并改正数据中错误的一步,其中包括检查数据一致性、处理无效值和缺失值。

二、步骤

切记!!!!数据在清洗之前一定要先备份,先备份。(如果没有进行备份,在处理数据过程中不小心处理错了,而此时没有原始数据,就…,懂得都懂啦)

1、选择列

根据自己所要分析的内容,在整个数据表格中只选择自己要分析的列即可,其余的列可以删除也可以隐藏,当然,隐藏是最好的选择。

2、缺失值处理

1、找到缺失值

如何在所得数据中快速找到缺失数据呢?可以关注每一列的行数,先定位到列,然后通过筛选,找到缺失值。

2、处理缺失值的方法

手工填写平均值:若数值是常规性的,则可以进行求取平均值进行填写。
删除:若不知道该处填什么,则删除。

3、数据类型转化

选中数据中的任意一个单元格,这个单元格的数据类型是文本。点击下拉按钮,可以将数据类型进行转化。
在这里插入图片描述

4、重复值处理

在EXCEL中,开始——>样式——>条件格式——>突出显示单元格规则——>重复值,既可以找到数据中的重复值。
找到重复值之后,可以结合业务要求,是否需要删除重复值。需要删除重复值的宝子们继续向下看哈~~
在EXCEL中,数据——>数据工具——>删除重复值——>如下图,按照自己的需求进行重复值删除
在这里插入图片描述

总结

以上就是今天总结的数据清洗的主要4个步骤,想要学习数据分析的伙伴们抓紧时间吧,动起来!!!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析----数据清洗 的相关文章

  • Ubuntu-22.10安装Redis

    Redis xff0c 英文全称是Remote Dictionary Server xff08 远程字典服务 xff09 xff0c 是一个开源的使用ANSIC语言编写 支持网络 可基于内存亦可持久化的日志型 Key Value数据库 xf
  • windows Server 2012 R2安装 “vc_redist.x64.exe“ 报错

    问题 xff1a 安装 34 vc redist x64 exe 34 失败 xff0c 0x80240017 未指定的错误 解决 xff1a 安装更新程序 KB2919442 与 KB2919355 KB2919442 下载地址 xff1
  • 浅谈DH参数(以华数机器人为例)

    1 DH参数说明 欧几里得空间中的直角坐标系由三个两两相交且相互垂直的轴构成 xff1a X 轴 xff0c Y轴和 Z轴 因此 xff0c 一个三维直角坐标系有六个变换自由度 xff1a 沿 X xff0c Y xff0c Z 轴的平移自

随机推荐

  • 常用浏览器 + WebDriver驱动下载网址汇总 + 浏览器内核版本查看

    常用浏览器 一 IE浏览器二 Microsoft Edge浏览器三 Chrome google 浏览器四 Firefox 火狐 浏览器五 Opera浏览器六 Safari浏览器七 其他1 QQ浏览器2 360浏览器3 搜狗浏览器4 猎豹浏览
  • Oracle报错记录(持续更新)

    问题目录 问题1 xff1a ORA 01950问题2 xff1a ORA 12514问题3 xff1a ORA 28547 问题1 xff1a ORA 01950 问题描述 xff1a 对表空间无权限 解决 xff1a 以管理员身份运行c
  • Tengine-Lite在Nvidia AGX Xavier上的安装

    一 说明 由于工作需要 在Nvidia AGX Xavier上使用Tengine Lite引擎进行模型的推理使用 Tengine Lite是什么 Tengine 由 OPEN AI LAB 主导开发 xff0c 该项目实现了深度学习神经网络
  • 一份完整的软件测试报告

    基于软件发布测试编写一份完整的测试报告所包含的内容 xff1a 模板提取链接 xff1a https pan baidu com s 1l7opbNU7fwHXl9UacM4opQ 提取码 xff1a mgzo
  • 【STM32学习笔记】(10)——蜂鸣器实验详解

    蜂鸣器实验 蜂鸣器的简介 蜂鸣器是一种一体化结构的电子讯响器 xff0c 采用 直流电压供电 xff0c 广泛应用于计算机 打印机 复印机 报警器 电子玩具 汽车电子设备 电话机 定时器等电子产品中作发声器件 蜂鸣器主要分为 压电式蜂鸣器和
  • 计算机网络实验

    Ipconfig命令 1 实作一 Ipconfig命令通常被用户用来查看计算机中的ip地址 xff0c 子网掩码以及默认网关 与之类似的ipconfig all命令则是显示ipconfig中所有的详细信息 其中 xff0c ipconfig
  • 在linux系统下搭建鸿蒙bearPi的编译环境

    前言 xff1a 我是Linux使用的是Ubuntu18 04 进行环境配置的 xff0c 如果环境不同导致报错请自行网上搜索答案 1 首先先下载必要的插件 链接 xff1a https pan baidu com s 15E3SBXj g
  • keil玩儿51单片机时遇见的错误与警告

    一 错误1 错误展示 错误说明 xff1a 自己写的代码太大 xff0c 超过了keil5能够编辑的最大范围2048 xff1b 解决方法 xff1a 1 xff09 使用注册机 xff0c 破解keil5 xff1b 2 xff09 调整
  • Linux从入门到精通(Ubuntu 16.04)第一节实验

    第一节实验 命令操作 sudo su root 管理员身份 exit 退出管理员身份 xff0c 进入普通用户身份 shutdown 关机 reboot 重启 cd 进入根目录 cd 从当前目录后退一级 ls 查看当前目录文件及文件夹 cd
  • 计算机网络 第一节 基于 Windows 的 TCP/IP 实用程序:Ipconfig、Ping、Tracert、 Netstat、arp。

    了解基本的基于 Windows 的 TCP IP 实用程序 xff1a Ipconfig Ping Tracert Netstat arp 1 使用 ping 命令测试本地主机 TCP IP 的安装以及两台主机的连通情况 2 使用 ipco
  • IP地址,子网掩码,默认网关理解

    IP地址 xff0c 子网掩码 xff0c 默认网关 通俗来讲 xff1a IP 地址 xff0c 是标注一台电脑的身份 xff0c 如同每个人都有的身份证 xff1b 子网掩码表示所使用的网络属于哪种网络段 xff0c 两个IP地址同属于
  • Linux从入门到精通(Ubuntu 16.04)第二节实验

    1 重定向 cd home 在home文件夹 ls l gt test2 在home文件夹下新建了test2文件夹 xff0c 里面写入了home文件夹下的内容 2交换分区 注意 xff1a 要在cd root下进行 xff0c 当时在这里
  • Linux 从入门到精通(Ubuntu 16.04)第三节实验

    1 User 用户管理命令 xff08 1 xff09 adduser 添加用户 adduser a1 添加普通用户a1 adduser system home home a2 shell bin bash a2 添加系统用 xff0c 户
  • Labelme标签转COCO2017数据集格式

    以下代码是将Labelme标注软件标注的目标检测矩形框标签转换成COCO2017数据集格式进行训练 一 Labelme标注软件的安装 在Annaconda创建虚拟环境及安装Labelme conda create n labelme pyt
  • 深度剖析问题:Could not run ‘torchvision::nms‘ with arguments from the ‘CUDA‘ backend.

    问题 xff1a 使用YOLOv5进行测试的时候 xff0c 报错 xff1a Could not run 39 torchvision nms 39 with arguments from the 39 CUDA 39 backend x
  • 算法学习模板——素数问题、费马小定理、LCM/GCD和欧拉降幂

    万里之行 xff0c 始于足下 本博客总结近期学习到的部分数论模板 xff0c 以便于日后查询使用 作者水平有限 xff0c 难免存在疏漏不足 xff0c 恳请诸位看官斧正 倘若我的文章可以帮到你 xff0c 十分荣幸 当然 xff0c 以
  • NVIDIA显卡BUG解决 Unable to determine the device handle for GPU 0000:02:00.0: Unknown Error

    报错 实验室去年到今年断了几次电 xff0c 然后服务器上的2080Ti一直就感觉有点小毛病 属于是被折磨了几个月了 然后前两周断电后 xff0c 显卡就基本上完全用不了了 xff0c 经常服务器开机都会失败 并且就算服务器开机成功过后 x
  • 数据库E-R图基础概念

    E R图也称实体 联系图 Entity Relationship Diagram xff0c 提供了表示实体类型 属性和联系的方法 xff0c 用来描述现实世界的概念模型 ER模型的基本元素 实体 xff1a 用方框表示 xff0c 实体名
  • 51单片机蜂鸣器

    蜂鸣器分为两类 1 有源蜂鸣器 2 无源蜂鸣器 有源蜂鸣器比较简单 xff0c 只要有电流通过 xff0c 蜂鸣器就会发声 一般改变不了音调和音量 无源蜂鸣器要给一定频率的脉冲信号 xff0c 蜂鸣器才会发出声音 对于无源蜂鸣器只要改变频率
  • 数据分析----数据清洗

    文章目录 前言一 数据清洗是什么 xff1f 二 步骤1 选择列2 缺失值处理1 找到缺失值2 处理缺失值的方法 3 数据类型转化4 重复值处理 总结 前言 随着科技的不断发展 xff0c 数据在我们生活中越来越多 xff0c 面对繁杂的数