pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件

2023-11-11

本系列课程适用人群：

python零基础数据分析的朋友；
在校学生；
职场中经常要处理各种数据表格，或大量数据（十万级以上）的朋友；
喜欢图表可视化的朋友；

系列视频目前可在B站观看，会定期更新，欢迎大家吐槽！

本节概要：数据量较大时一般保存为csv或者txt文件，注意分隔符设置

本节代码：

"""
# =============================================================================
# 3.2 读取csv txt文件  ： pandas.read_csv()
# =============================================================================

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, 
                header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, 
                mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, 
                false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, 
                na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, 
                parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, 
                dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', 
                thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, 
                escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True,
                warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, 
                float_precision=None)

**常用参数：**
    - filepath_or_buffer ：文件路径 ，和读取excel中io参数一样
    - sep ：分隔符，默认逗号
    - encoding ：一般utf-8 或者 gbk                                                                       
"""
# 导入pandas工具包，并简写为pd
import pandas as pd

# =============================================================================
# # 读取csv数据
# =============================================================================
data1 = pd.read_csv('D:/python/课件/data/titanic_train.csv')

# =============================================================================
# # 读取txt数据
# =============================================================================
data2 = pd.read_csv('D:/python/课件/data/zhengqi_train.txt')   # 读取后数据没有按照列分开
data3 = pd.read_csv('D:/python/课件/data/zhengqi_train.txt',sep='\t')  #其他特殊符号：回车(\r),换行(\n),制表符(\t),空白字符\s 多个空白字符\s+

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python数据分析技巧

python

数据分析

pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件的相关文章

是否可以模拟 Python 3.6 中的内置 len() 函数？

是否可以模拟内置len Python 3 6 中的函数我有一个类定义了一个简单的方法该方法依赖于len 函数如下 class MyLenFunc object def is longer than three characters se
KFold 和 ShuffleSplit CV 有什么区别？

看起来 KFold 每次迭代对象时都会生成相同的值而 Shuffle Split 每次都会生成不同的索引它是否正确如果是这样其中一个相对于另一个有什么用处 cv cross validation KFold 10 n folds 2
底图上的子图

我有一张英国地图和 121 个地点每个地点有 3 个值我想绘制 121 个位置中每个位置的三个值的小条形图目前这些值绘制为markersize属性看起来像这样密集恐惧症情节 https i stack imgur com 5fv
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
如何在 ReportLab 段落中插入回车符？

有没有办法在 ReportLab 的段落中插入回车符我试图将 n 连接到我的段落字符串但这不起作用 Title Paragraph Title n Page myStyle 我想要这样做因为我将名称放入单元格中并且想要控制单元格中的
字典中的列表，Python 中的循环

我有以下代码 TYPES hotmail type hotmail lookup mixed dkim no signatures S Return Path email protected cdn cgi l email protecti
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
Python 正则表达式部分匹配或“hitEnd”

我正在编写一个扫描器因此我将任意字符串与正则表达式规则列表进行匹配如果我可以模拟 Java hitEnd 功能不仅知道正则表达式何时不匹配还知道何时匹配这将非常有用 can t匹配当正则表达式匹配器在决定拒绝输入之前到达输入末尾
如何修复错误“AttributeError：‘模块’对象在 python3 中没有属性‘客户端’？

以下是我的代码 import http h1 http client HTTPConnection www bing com 我认为没问题但是 python 给了我以下错误 AttributeError 模块对象没有属性客户端我想知
如何从 Python 中指定运行程序的输入文件？

我正在编写一个外部脚本以通过笔记本电脑上的 Python mrjob 模块而不是在 Amazon Elastic Compute Cloud 或任何大型集群上运行 mapreduce 作业我读自mrjob文档 http packag
如何对这个 Flask 应用程序进行单元测试？

我有一个 Flask 应用程序它使用 Flask Restless 来提供 API 我刚刚写了一些身份验证来检查如果消费者主机被识别该请求包含一个哈希值通过加密 POST 的请求内容和 GET 的 URL 以及秘密 API 密钥来计
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
求解不等式系统时“多项式错误：仅允许使用单变量多项式”

我想找到以下两个常数的区间cons1 and cons2我写了下面的代码 from sympy import Poly from sympy import Abs from sympy solvers inequalities import
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
如何强制 Y 轴仅使用整数

我正在使用 matplotlib pyplot 模块绘制直方图我想知道如何强制 y 轴标签仅显示整数例如 0 1 2 3 等而不显示小数例如 0 0 5 1 1 5 2 等我正在查看指导说明并怀疑答案就在附近matplotlib
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
为什么 bot.get_channel() 会产生 NoneType？

我正在制作一个 Discord 机器人来处理公告命令当使用该命令时我希望机器人在特定通道中发送一条消息并向用户发送一条消息以表明该命令已发送但是我无法将消息发送到频道我尝试了这段代码 import discord import
如何正确消除字典中的元素直到只剩下一个字符串

我真的需要这方面的帮助 def get winner dict winner new dict for winner in dict winner first letter winner 0 value dict winner winner
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client

随机推荐

caffe源码学习中--src/caffe/solver.cpp

include caffe solver factory hpp中的solverRegistry类和SolverRegisterer 类 brief A solver factory that allows one to register
Unity屏幕坐标（Input.mousePosition）转换UI坐标

Unity屏幕坐标 Input mousePosition 转换UI坐标 1 屏幕坐标的起点位置左下角为 0 0 点右上角为 Screen width Screen height 2 UI坐标的起点位置屏幕中心点方法一 Vector
linux下svn服务器搭建及使用（包含图解）

今天自己动手在linux搭建了svn服务器把具体过程和一些自己的见解分享给大家希望对大家有所帮助客户端svn 大家见到的小乌龟下载地址为 http tortoisesvn net downloads html 这里客户端的安装就不作
Lua使用指南

目录简介环境配置基本语法变量运算符数据类型字符串 table 表函数常用语句 if while 循环 repeat until for循环简介 lua 是一种开源轻量的脚本语言其设计目的是嵌入应用程序中为应用程序提
Android imageview设置背景图，src，background，foreground

foreground src 和 background 属性区别 1 background指的是背景 foreground指的是前景而src指的是内容三者可以同时使用 2 src填入图片时是按照图片大小直接填充并不会进行拉伸而使用
Ubuntu搭建PPTP和连接到PPTP

Ubuntu16 04搭建PPTP服务 TP link端口映射检测服务器是否支持MPPE模块 sudo modprobe ppp compress 18 echo MPPE is ok 如果输出 MPPE is ok 则说明服务器的lin
映射表

集是一个集合它可以快速地寻找现有的元素但是要查看元素就需要查看的元素的精确副本这不是一种非常通用的查找方式通常我们知道某些键的信息并想要查找与之相对应的元素映射表 map 数据结构就是为此设计的映射表用来存放键值对如果提
【Quant】80＋面试，5个offer，Quant大神总结分享各家quant面试题

Why Quant 在北美这个工作基本上是理工科的中国学生进入金融领域最主要的渠道而且现在国内也有朝这方面发展的趋势如果你是理工科背景或者对数理编程和金融比较感兴趣不妨尝试在就业的时候向这个领域发展它的一个好处是在工作的时候
linux中关闭防火墙

systemctl status firewalld查看当前防火墙状态 systemctl stop firewalld关闭当前防火墙 systemctl disable firewalld开机防火墙不启动
解决合并单元格筛选时只出现首行的小技巧

前言 Excel小窍门让办公更便捷情景合并单元格后单一筛选时只会显示对应的第一行数据原因 Excel筛选单元格时遇到不连续区域即中间有空白单元格会识别不到后续内容合并单元格后除首行外其余行的值会被自动清空从而导致在筛
NGINX--初步变量详解

一编译echo模块 1 echo模块下载以及解压 wget c https gitee com mirrors echo nginx module repository archive master zip unzip master zi
电脑提示d3dcompiler_47.dll缺失怎么修复？

d3dcompiler 47 dll是 Microsoft 的 DirectX 11 核心组件之一它主要用于编译和运行 Direct3D 11 应用程序和游戏如果您的系统中缺少这个 DLL 文件可能会导致一些程序无法正常运行很多游戏
CMake----if与option使用小记

在CMake中if语法比较简单 if后面括号中的参数随着CMake版本的推进在else和endif中也可以不用写了 if address else endif 对于if语法比较常用的就是字符串比较了这里个人简单用到过两种一种是这个变
使用scoped穿透方法实现修改vue中mint UI组件样式

效果代码 div class goods swiper div
图书商城系统

摘要随着信息科学技术的不断发展与完善信息化已经成为个人之间甚至是国家之间商务发展的一大趋势并且广泛应用于商业贸易国际化的网络计算机科学以及网络通信之中电子商务正是依托信息化技术的迅猛发展将全球化的市场集中在网络平台之中打破了
c++基本类型和变量

基本类型 c 内置类型 setlocale LC ALL chs bool bo true char ch a wchar t wch L 中国 short sh 32767 32768 32767 int i 10 32768 32767
runas 显示740 所需的操作需要提升的解决方法

域环境中有些软件启动需要用到管理员权限所以对user用户来说比较麻烦对IT来说也挺麻烦每次使用都需要输一次账号密码后来使用了runas工具就方便了虽然有些不安全今天发现这个不起作用了 cmd里输入语句提示 740 所需的操作
C语言内存四区的学习总结（一）---- 静态区

最近重新学习C语言相关知识重新提到内存四区的概念那么在之前的学习的基础上在这儿做一个简单的总结与分享一内存四区建立的流程可以简单直观的查看下面的这个图片直接的说明我们的程序在内存中是如何去存储运行程序运行的流程说明 1 操
引入字体包

我接触的设计师都比较喜欢用苹方字体然后每次都要引入字体包首先一定要设计师给ttf格式的文件然后在scss中引入 font face font family PingFangSC Regular font weight normal s
pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件

本系列课程适用人群 python零基础数据分析的朋友在校学生职场中经常要处理各种数据表格或大量数据十万级以上的朋友喜欢图表可视化的朋友系列视频目前可在B站观看会定期更新欢迎大家吐槽本节概要数据量较大时一般保存为csv或

pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件

pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件 的相关文章

随机推荐

热门标签

pandas数据读取与清洗视频03-pd.read_csv()读取csv、txt文件的相关文章