pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件

2023-11-11

本系列课程适用人群:

  1. python零基础数据分析的朋友;
  2. 在校学生;
  3. 职场中经常要处理各种数据表格,或大量数据(十万级以上)的朋友;
  4. 喜欢图表可视化的朋友;

系列视频目前可在B站观看,会定期更新,欢迎大家吐槽!

本节概要:数据量较大时一般保存为csv或者txt文件,注意分隔符设置

视频地址:python读取csv、txt文件

本节代码:

"""
# =============================================================================
# 3.2 读取csv txt文件  : pandas.read_csv()
# =============================================================================

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, 
                header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, 
                mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, 
                false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, 
                na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, 
                parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, 
                dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', 
                thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, 
                escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True,
                warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, 
                float_precision=None)

**常用参数:**
    - filepath_or_buffer :文件路径 ,和读取excel中io参数一样
    - sep :分隔符,默认逗号
    - encoding :一般utf-8 或者 gbk                                                                       
"""
# 导入pandas工具包,并简写为pd
import pandas as pd

# =============================================================================
# # 读取csv数据
# =============================================================================
data1 = pd.read_csv('D:/python/课件/data/titanic_train.csv')

# =============================================================================
# # 读取txt数据
# =============================================================================
data2 = pd.read_csv('D:/python/课件/data/zhengqi_train.txt')   # 读取后数据没有按照列分开
data3 = pd.read_csv('D:/python/课件/data/zhengqi_train.txt',sep='\t')  #其他特殊符号:回车(\r),换行(\n),制表符(\t),空白字符\s 多个空白字符\s+

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件 的相关文章

随机推荐

  • caffe源码学习中--src/caffe/solver.cpp

    include caffe solver factory hpp中的solverRegistry类和SolverRegisterer 类 brief A solver factory that allows one to register
  • Unity屏幕坐标(Input.mousePosition)转换UI坐标

    Unity屏幕坐标 Input mousePosition 转换UI坐标 1 屏幕坐标的起点位置 左下角为 0 0 点 右上角为 Screen width Screen height 2 UI坐标的起点位置 屏幕中心点 方法一 Vector
  • linux下svn服务器搭建及使用(包含图解)

    今天自己动手在linux搭建了svn服务器 把具体过程和一些自己的见解分享给大家 希望对大家有所帮助 客户端svn 大家见到的小乌龟 下载地址为 http tortoisesvn net downloads html 这里客户端的安装就不作
  • Lua使用指南

    目录 简介 环境配置 基本语法 变量 运算符 数据类型 字符串 table 表 函数 常用语句 if while 循环 repeat until for循环 简介 lua 是一种开源 轻量的脚本语言 其设计目的是嵌入应用程序中 为应用程序提
  • Android imageview设置背景图,src,background,foreground

    foreground src 和 background 属性区别 1 background指的是背景 foreground指的是前景 而src指的是内容 三者可以同时使用 2 src填入图片时 是按照图片大小直接填充 并不会进行拉伸 而使用
  • Ubuntu搭建PPTP和连接到PPTP

    Ubuntu16 04搭建PPTP服务 TP link端口映射 检测服务器是否支持MPPE模块 sudo modprobe ppp compress 18 echo MPPE is ok 如果输出 MPPE is ok 则说明服务器的lin
  • 映射表

    集是一个集合 它可以快速地寻找现有的元素 但是要查看元素 就需要查看的元素的精确副本 这不是一种非常通用的查找方式 通常 我们知道某些键的信息 并想要查找与之相对应的元素 映射表 map 数据结构就是为此设计的 映射表用来存放键值对 如果提
  • 【Quant】80+面试,5个offer,Quant大神总结分享各家quant面试题

    Why Quant 在北美 这个工作基本上是理工科的中国学生进入金融领域最主要的渠道 而且 现在国内也有朝这方面发展的趋势 如果你是理工科背景 或者对数理 编程和金融比较感兴趣 不妨尝试在就业的时候向这个领域发展 它的一个好处是在工作的时候
  • linux中关闭防火墙

    systemctl status firewalld查看当前防火墙状态 systemctl stop firewalld关闭当前防火墙 systemctl disable firewalld开机防火墙不启动
  • 解决合并单元格筛选时只出现首行的小技巧

    前言 Excel小窍门 让办公更便捷 情景 合并单元格后 单一筛选时只会显示对应的第一行数据 原因 Excel筛选单元格时 遇到不连续区域 即中间有空白单元格 会识别不到后续内容 合并单元格后 除首行外 其余行的值会被自动清空 从而导致在筛
  • NGINX--初步变量详解

    一 编译echo模块 1 echo模块下载以及解压 wget c https gitee com mirrors echo nginx module repository archive master zip unzip master zi
  • 电脑提示d3dcompiler_47.dll缺失怎么修复?

    d3dcompiler 47 dll是 Microsoft 的 DirectX 11 核心组件之一 它主要用于编译和运行 Direct3D 11 应用程序和游戏 如果您的系统中缺少这个 DLL 文件 可能会导致一些程序无法正常运行 很多游戏
  • CMake----if与option使用小记

    在CMake中if语法比较简单 if后面括号中的参数随着CMake版本的推进 在else和endif中也可以不用写了 if address else endif 对于if语法 比较常用的就是字符串比较了 这里个人简单用到过两种 一种是这个变
  • 使用scoped穿透方法实现修改vue中mint UI组件样式

    效果 代码 div class goods swiper div
  • 图书商城系统

    摘 要 随着信息科学技术的不断发展与完善 信息化已经成为个人之间甚至是国家之间商务发展的一大趋势 并且广泛应用于商业贸易 国际化的网络 计算机科学以及网络通信之中 电子商务正是依托信息化技术的迅猛发展将全球化的市场集中在网络平台之中 打破了
  • c++基本类型和变量

    基本类型 c 内置类型 setlocale LC ALL chs bool bo true char ch a wchar t wch L 中国 short sh 32767 32768 32767 int i 10 32768 32767
  • runas 显示740 所需的操作需要提升的解决方法

    域环境中 有些软件启动需要用到管理员权限 所以对user用户来说比较麻烦 对IT来说也挺麻烦 每次使用都需要输一次账号密码 后来使用了runas工具就方便了 虽然有些不安全 今天发现这个不起作用了 cmd里输入语句 提示 740 所需的操作
  • C语言内存四区的学习总结(一)---- 静态区

    最近重新学习C语言相关知识 重新提到内存四区的概念 那么在之前的学习的基础上 在这儿做一个简单的总结与分享 一 内存四区建立的流程 可以简单直观的查看下面的这个图片 直接的说明我们的程序在内存中是如何去存储 运行 程序运行的流程说明 1 操
  • 引入字体包

    我接触的设计师都比较喜欢用苹方字体 然后每次都要引入字体包 首先一定要设计师给ttf格式的文件 然后在scss中引入 font face font family PingFangSC Regular font weight normal s
  • pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件

    本系列课程适用人群 python零基础数据分析的朋友 在校学生 职场中经常要处理各种数据表格 或大量数据 十万级以上 的朋友 喜欢图表可视化的朋友 系列视频目前可在B站观看 会定期更新 欢迎大家吐槽 本节概要 数据量较大时一般保存为csv或