python的panda库读写文件

2023-05-16

目录

1.读取excel文件

(1)语法

(2)实例

2.读取cvs文件

(1)语法

(2)实例

3.读取txt文件

(1)语法

(2)实例

4.写入文件

(1)语法

(2)实例


1.读取excel文件

(1)语法

import pandas  as pd
data = pd.read_excel(io,
    sheet_name=0,
    header=0,
    names=None,
    index_col=None,
    usecols=None,
    squeeze=False,
    dtype=None,
    engine=None,
    converters=None,
    true_values=None,
    false_values=None,
    skiprows=None,
    nrows=None,
    na_values=None,
    keep_default_na=True,
    na_filter=True,
    verbose=False,
    parse_dates=False,
    date_parser=None,
    thousands=None,
    comment=None,
    skipfooter=0,
    convert_float=True,
    mangle_dupe_cols=True)

常用参数说明

io:读取的excel文件名,如r'./vote.excel'。

sheet_name: excel文件中的sheet表名。

header: 哪一行设置为列索引,默认是第一行,即header = 0。

names: 列索引名。

index_col: 使用哪一列作为行索引,默认从0开始。

usecols: 读取表格中哪几列,必须是位置索引。

skiprows: 跳过前几行读取文件,默认从0开始。

nrows: 读取多少行数据。

(2)实例

读取文件中的分类sheet的指定列的六行数据。

import pandas as pd
data  = pd.read_excel(r'.\data\sep_word - 1.0.xlsx',sheet_name= '分类',header= 0,nrows=6,usecols=[0,1,3,5])
data

输出结果为

 解释:usecols=[0,1,3,5]是指第1,2,4,6列。


2.读取cvs文件

(1)语法

import pandas  as pd
data = pd.read_cvs(filepath_or_buffer: FilePathOrBuffer,
    sep=",",
    delimiter=None,
    # Column and Index Locations and Names
    header="infer",
    names=None,
    index_col=None,
    usecols=None,
    squeeze=False,
    prefix=None,
    mangle_dupe_cols=True,
    # General Parsing Configuration
    dtype=None,
    engine=None,
    converters=None,
    true_values=None,
    false_values=None,
    skipinitialspace=False,
    skiprows=None,
    skipfooter=0,
    nrows=None,
    # NA and Missing Data Handling
    na_values=None,
    keep_default_na=True,
    na_filter=True,
    verbose=False,
    skip_blank_lines=True,
    # Datetime Handling
    parse_dates=False,
    infer_datetime_format=False,
    keep_date_col=False,
    date_parser=None,
    dayfirst=False,
    cache_dates=True,
    # Iteration
    iterator=False,
    chunksize=None,
    # Quoting, Compression, and File Format
    compression="infer",
    thousands=None,
    decimal: str = ".",
    lineterminator=None,
    quotechar='"',
    quoting=csv.QUOTE_MINIMAL,
    doublequote=True,
    escapechar=None,
    comment=None,
    encoding=None,
    dialect=None,
    # Error Handling
    error_bad_lines=True,
    warn_bad_lines=True,
    # Internal
    delim_whitespace=False,
    low_memory=_c_parser_defaults["low_memory"],
    memory_map=False,
    float_precision=None)

参数说明:

csv文件是以逗号为分隔符的文件,读取参数与excel基本类似,文件为gbk格式的csv,若不设置encoding参数,会报错。

encoding:默认为'utf-8',还有中文编码‘gbk’、‘gb18030’、‘gb2312’。

就我们关心的汉字而言,三种编码方式的表示范围是:
GB18030 > GBK > GB2312
即GBK是GB2312的超集,GB1803又是GBK的超集。
一般读取中文文本可以直接用encoding =GB18030

(2)实例

直接读取不设置编码方式,储存方式可能存在gbk格式,中文会乱码。

import pandas as pd
data = pd.read_csv(r'.\python\python数据分析\word.csv')
data

输出结果为:

一般用encoding= 'utf-8'可以解决很多编码乱码问题,但是还是报错。

显示:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 37: invalid start byte

 可能是因为中文储存的时候是gbk格式,utf-8还是识别不了一些编码,所以可以尝试用gbk,需要设置编码方式encoding='gbk'。

import pandas as pd
data = pd.read_csv(r'.\python\python数据分析\word.csv',encoding='gbk')
data

 输出结果为:

只想查看前10行数据用head函数。

data.head(10) #查看前十行数据

data.head()  #默认显示前5行数据


3.读取txt文件

(1)语法

import pandas  as pd
data = pd.read_table(filepath_or_buffer: FilePathOrBuffer,
    sep="\t",
    delimiter=None,
    # Column and Index Locations and Names
    header="infer",
    names=None,
    index_col=None,
    usecols=None,
    squeeze=False,
    prefix=None,
    mangle_dupe_cols=True,
    # General Parsing Configuration
    dtype=None,
    engine=None,
    converters=None,
    true_values=None,
    false_values=None,
    skipinitialspace=False,
    skiprows=None,
    skipfooter=0,
    nrows=None,
    # NA and Missing Data Handling
    na_values=None,
    keep_default_na=True,
    na_filter=True,
    verbose=False,
    skip_blank_lines=True,
    # Datetime Handling
    parse_dates=False,
    infer_datetime_format=False,
    keep_date_col=False,
    date_parser=None,
    dayfirst=False,
    cache_dates=True,
    # Iteration
    iterator=False,
    chunksize=None,
    # Quoting, Compression, and File Format
    compression="infer",
    thousands=None,
    decimal: str = ".",
    lineterminator=None,
    quotechar='"',
    quoting=csv.QUOTE_MINIMAL,
    doublequote=True,
    escapechar=None,
    comment=None,
    encoding=None,
    dialect=None,
    # Error Handling
    error_bad_lines=True,
    warn_bad_lines=True,
    # Internal
    delim_whitespace=False,
    low_memory=_c_parser_defaults["low_memory"],
    memory_map=False,
    float_precision=None)

参数说明:

txt文件是以指制表符\t为分隔符的文件,参数与excel、csv基本类似,不同的地方在于必须要指定sep。

sep:默认为'\t'。

(2)实例

读取竞选文档。

data = pd.read_table(r'.\python\python数据分析\智能空调项目\python_study\vote.txt')
data

输出结果为:


4.写入文件

excel,csv,txt写入文件的方式基本类似,以pandas的to_xx()方式写入。

(1)语法

#写入excel文件
to_excel(
        self,
        excel_writer,
        sheet_name="Sheet1",
        na_rep="",
        float_format=None,
        columns=None,
        header=True,
        index=True,
        index_label=None,
        startrow=0,
        startcol=0,
        engine=None,
        merge_cells=True,
        encoding=None,
        inf_rep="inf",
        verbose=True,
        freeze_panes=None
    ) 

 常用参数说明:

index: 是否保留行索引,默认是True保留,False表示不保留。

columns: 通过列索引指定所需列。

sheet_name: 表名,默认为‘sheet1’。

encoding:编码格式,utf-8或者gbk。

na_rep: 缺失值填充,可指定为0。

index_label: 行索引标签。

header: 默认为True,False没有列索引,如需更改列名,则header = ["列1","列2","列3"]

(2)实例

将txt文档写为xlsx文件。

import pandas as pd #导入pandas库
#读入txt文档
data = pd.read_table(r'.\python\python数据分析\智能空调项目\python_study\vote.txt',sep='\t')
#写入excel文档
data.to_excel(r'./vote.xlsx',sheet_name='vote',na_rep='')

参考文章:

python学习之路--pandas读写文件 - 知乎 (zhihu.com)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python的panda库读写文件 的相关文章

  • redhat如何安装python2.x/python3.x(eg.python-2.7.18)

    1 下载源码包 后面的下载链接直接在python官网找的 xff0c 如果想安装更高的版本自行更换 wget https www python org ftp python 2 7 18 Python 2 7 18 tgz wget htt
  • 单车管理系统——1.文档设计及sql代码说明

    SQL server 设计 目录 xff1a 1 各个表的建立 2 级联操作 3 触发器和存储过程 4权限管理 注 xff1a 由于表比较多 xff0c sql语句很长 xff0c 所以下面的说明中每样只举一个或两个例子 xff0c 1 各
  • 单车管理系统——2.delphi页面说明

    Delphi页面设计及说明 目录 xff1a 1 登录页面 2 用户注册页面 3 用户主页面 xff08 包含 用户充值页面 xff0c 用户骑行记录页面 和 用户注销页面 xff09 4 维修员主页面 5 管理员主页面 1 登录页面 页面
  • 单车管理系统——3.delphi主要代码说明

    Delphi部分代码 目录 xff1a 1 登录页面代码 2 用户注册页面代码 3 用户主页面代码 3 1 用户充值页面代码 3 2 用户骑行记录页面代码 3 3 用户注销页面代码 4 维修员主页面代码 5 管理员主页面代码 1 登录页面代
  • 北理工-2021年春-《数字逻辑》实验

    北理工 2021年春 数字逻辑 实验 实验二 组合电路设计 实验目的 本实验通过设计一个组合电路实例 xff0c 让学生掌握组合逻辑电路从设计到验证的全过程 通过该实验 xff0c 可以加深学生对组合电路原理和设计的理解 xff0c 同时可
  • 实验1.SQL Server的安全机制

    目录 xff1a 1 实验目的 2 实验内容 3 回答问题 sql代码 https download csdn net download weixin 50836014 85970089 实验环境 xff1a Windows10 Micro
  • 实验2.售后服务管理系统数据建模

    售后服务管理系统数据建模 逻辑模型 物理模型 SQL代码与实验报告的位置 xff1a https download csdn net download weixin 50836014 85970144 实验环境 xff1a 操作系统 xff
  • 实验3.选课系统

    实验3 选课系统 文章目录 一 实验要求二 SQL Server 数据库设计三 Visual Studio 页面设计与功能实现1 登录页面2 选课页面 xff08 1 xff09 退课 xff08 2 xff09 选课 xff08 3 xf
  • 北京理工大学—计算机专业课程资源

    声明 xff1a 以下资源仅供大家学习交流使用 代码 仅供参考 xff0c 注意代码查重 课件 不用于收益 xff0c 部分涉及老师版权 xff0c 考题 大家根据需要使用 笔记 仅对本人自己负责 xff0c 无法保证不同年级不同老师的课程
  • 远程连接服务器突然失败

    xff0c 前些天还可以远程连接虚拟机 xff0c 但是某天突然不能连接了 分别用mobaxterm vscode xshell远程连接 mobaxterm报错 xff1a Remote side unexpectedly closed n
  • 关于VS2019未能正确加载“visual studio commom ide package包”

    方法一 xff1a 在开始菜单栏找到 xff1a 打开后输入 xff1a devenv resetuserdata devenv resetsettings VS2019会自动重启 如果没有解决 xff0c 看方法二 方法二 xff1a 删
  • Centos 7/8 systemctl和防火墙firewalld命令

    一 防火墙的开启 关闭 禁用命令 xff08 1 xff09 设置开机启用防火墙 xff1a systemctl enable firewalld service xff08 2 xff09 设置开机禁用防火墙 xff1a systemct
  • 如何在VS2019中修改默认的python环境

    安装完pytorch后需要设置VS2019的python环境 xff0c 具体步骤如下 xff1a 1 右击右侧的资源管理器中的 Python环境 点击 添加环境 xff0c 选择现有环境 2 再次右击右侧的资源管理器中的 Python环境
  • Windows安装TVM详细教程及报错提示

    Windows中安装TVM xff0c 网上有各种教程 xff0c 但是由于某些原因 xff0c 总是无法安装成功 xff0c 这大概率是各种工具之间的版本不兼容原因 注 xff1a 虽然本博客是为了教大家在windows中安装tvm xf
  • linux(ubuntu20.04)安装tvm-0.9.0+llvm+cuda/cudnn(一步到胃版)

    我是在双系统中linux上安装的 xff0c 不是Ubuntu虚拟机 xff0c 虽然两者过程基本一样 xff0c 但是在双系统上会更方便 文章目录 零 xff1a 究极大招版一 xff1a 环境准备1 1 安装gcc cmake等必要的依
  • ubuntu20.04安装qq音乐并解决闪退问题

    在qq音乐官网下载linux版coco音乐 xff1a https y qq com download download html 下载deb包并且通过下面命令行安装 xff1a span class token function sudo
  • Jetson nano 系统初始化设置

    Jetson nano 系统初始化设置 Jetpack 4 3 源镜像官网链接下载 文章目录 Jetson nano 系统初始化设置 更换源 设置中文输入法 安装QQ 便携式设置1 更改窗口菜单栏位置2 设置屏幕待机时不会自动关闭3 一键打
  • public、private、protected的区别

    在成员访问模式中 xff1a public 表示共有 xff1b 类的数据成员和函数可以被该类对象和派生类访问 private 私有型 xff1b 自己的类可以访问 xff0c 但派生类不能访问 protected 保护型 xff1b 自身
  • python将字符串转换大小写的四大函数——lower、upper、capitalize、title函数

    目录 1 四大转换大小写的函数 1 lower函数的语法及用法 语法 string lower 用法 xff1a 将字符串的区分大小写的字符全转为小写 2 upper函数的语法及用法 语法 string upper 用法 xff1a 将字符
  • python判断字符串是否全为空字符——isspace函数的用法及实例

    目录 1 isspace函数的语法及用法 语法 string isspace 用法 xff1a 判断字符串是否只含有空字符 2 isspace的实例 xff08 1 xff09 简单的用法 xff08 2 xff09 与if条件函数结合使用

随机推荐