用 pandas 解析打印精美的表格数据

2024-02-17

复制包含不同分隔符、列名中的空格等的表的最佳方法是什么？该函数pd.read_clipboard()无法自行管理此任务。

示例1：

| Age Category | A | B  | C  | D |
|--------------|---|----|----|---|
| 21-26        | 2 | 2  | 4  | 1 |
| 26-31        | 7 | 11 | 12 | 5 |
| 31-36        | 3 | 5  | 5  | 2 |
| 36-41        | 2 | 4  | 1  | 7 |
| 41-46        | 0 | 1  | 3  | 2 |
| 46-51        | 0 | 0  | 2  | 3 |

预期结果：

 Age Category  A  B   C   D    
 21-26         2  2   4   1 
 26-31         7  11  12  5 
 31-36         3  5   5   2 
 36-41         2  4   1   7 
 41-46         0  1   3   2 
 46-51         0  0   2   3

EDIT:

示例2：

+---+---------+--------+
| id|firstName|lastName|
+---+---------+--------+
|  1|     Mark|   Brown|
|  2|      Tom|Anderson|
|  3|   Joshua|Peterson|
+---+---------+--------+

预期结果：

   id firstName  lastName
0   1      Mark     Brown
1   2       Tom  Anderson
2   3    Joshua  Peterson

我寻找一种可以应用于最常见表类型的通用方法。

之所以如此复杂，是因为这些类型的 ASCII 表在设计时并未真正考虑到数据传输。它们的真正功能是以视觉上令人愉悦的方式描绘数据。

这并不意味着不能用它来转移到 pandas 中！让我们从.read_clipboard():

df = pd.read_clipboard(sep='|').iloc[1:,1:-1]

我们定义的不是使用逗号作为（默认）分隔符|作为分隔符。

The .iloc[1:,1:-1]去掉第一行（-----------）和第一列和最后一列：因为尾随|在每行的开头和结尾pandas在那里看到一个“空”列。

现在剩下的就是从列名和值中去除空格：

stripped_columns = []
for column_name in df.columns:
    df[column_name] = df[column_name].str.strip()
    stripped_columns.append(column_name.strip())
df.columns = stripped_columns

如果你想要Age Category成为你的索引：

df.set_index('Age Category', inplace=True)

我要做的最后一步是确保所有列现在实际上保存的是数字而不是字符串：

df = df.astype('int')

导致：

<class 'pandas.core.frame.DataFrame'>
Index: 6 entries, 21-26 to 46-51
Data columns (total 4 columns):
A    6 non-null int64
B    6 non-null int64
C    6 non-null int64
D    6 non-null int64
dtypes: int64(4)
memory usage: 400.0+ bytes

我不确定您从剪贴板中读取它的原因是什么。更优雅的解决方案可能是将其粘贴到.csv归档并使用更高级的功能.read_csv() https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html必须提供。然而，必要的转变将保持不变。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

clipboard

copypaste

用 pandas 解析打印精美的表格数据的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

我可以让 javascript 同时做两件事吗？

我有一个奇怪的需求我想在 javascript 中执行以下操作当一个函数被调用时我想要更改 DIV 的颜色并然后 1 2 秒后我想把它改回来与 1 同时我会比如进行 Ajax 调用电话通常需要一秒钟换句话说我希望步骤
木偶在循环中添加数组元素

我想要这样的东西 ssl domains dev mydomain com admin api web each site tom jeff harry each developer ssl domains lt lt site devel
使用 Chef 时主管打开文件限制不会改变

我正在机器上修改 etc security limits conf 然后在 Chef 配方中安装 Supervisor 菜谱运行完成后如果我运行cat proc
DNSPython 异步解析超时，但同步解析不会超时

我在 Python 3 9 7 x64 dnspython 2 1 0 和 Windows 10 21H1 上执行了测试问题很简单 dns resolver Resolver 工作正常但不dns asyncresolver Resolve
使用相同的密钥签署两个应用程序

我构建了两个应用程序第一个应用程序 com pakname pak1 第二个应用程序使用 com pakname pak2 包名称然后我得到了一个密钥 mykey keystore 如果我使用相同的密钥对这两个应用程序进行签名并将它们发
在手机上自动播放视频？ Facebook Home 做到了。我缺少什么？

我正在尝试将视频添加到我的主页来代替滑块我了解移动设备如何以及为何禁用自动播放但是 FacebookHome 和 Youtube 将在移动设备上自动播放 https bg bg facebook com home https bg bg
在 Firemonkey 中获取应用程序路径

因此在 VCL 中可以使用以下代码行来检索应用程序路径 ExtractFilePath Application ExeName 我尝试了同样的 Firemokey 我注意到 ExeName 不再可用我可以使用什么代码来替代这个尝试使
导轨型号

我有一个名为 test rb 的模型当我在控制器中使用 tests Test new 时出现以下错误有人可以告诉我如何解决这个问题吗测试模块的未定义方法新如果您认为存在命名冲突则看起来 test 已经是名为 Test 的模块
如何使用-webkit-animation - 向外环创建脉冲效果

我找到了这篇文章 http www zurb com article 221 css3 animation will rock your world http www zurb com article 221 css3 animation
像编辑文本一样的旋转器

我有一个带有 TextInputLayout TextInputEditText 和微调器的表单我想要微调器高度换行文本但下拉列表中有大项目问题是微调器的高度取决于下拉项的高度 simple spinner dropdown item
JavaFX：使用REST服务并在前端显示数据

我正在开发一个 JavaFX 在带有 SceneBuilder 的 JDK8 上项目该项目应该与基于 Spring MVC 的服务器连接我想从服务器访问一些对象并显示它我已经对 Spring 服务器进行了编程以根据请求返回所需的对
为什么 Type.GetFields() 不返回基类中的支持字段？

在 C 中如果您使用Type GetFields 对于表示派生类的类型它将返回 a 派生类中所有显式声明的字段 b 派生类中自动属性的所有支持字段以及 c 基类中所有显式声明的字段为什么基类中自动属性的 d 支持字段缺失 Exampl
适用于（嵌入式 C/C++）开发人员的 Eclipse IDE 2020-12：经典深色主题深黑色背景和菜单中的文本

Eclipse 2020 12 4 18 中 C C 的深色经典主题存在问题菜单全黑顶部面板也有同样的问题那是一个bugEclipse TMF 默认包含在面向 C C 开发人员的 Eclipse IDE and the 面向嵌入式
将 JavaScript 日期转换为 .NET 日期的最佳方法

我在 JavaScript 中有一个日期它的值是这样的 2011 年 4 月 1 日星期五 05 00 00 GMT 0530 印度标准时间现在将日期转换为 NET 日期的最佳方法是什么请注意我的客户端用户可以位于世界各地我将从那
如何在 Javascript 中向用户显示是/否消息框？

如何在 Javascript 客户端向用户显示是否消息框我不想向用户显示确定和取消这是默认行为confirmJavaScript 中的函数任何帮助将不胜感激您无法修改默认确认框的确定取消但您可以使用第 3 方库例如
Python 中的指针？ ` x.pointerDest = y.pointerDest`?

我正在把我的老问题分成几个部分因为它非常混乱here https stackoverflow com questions 4590407 how can i evaluate variable to another variable be
在 C# 中使用属性反序列化 XML

我在反序列化 API 调用的 XML 响应时遇到问题我的选项对象的属性描述为空下面是 XML 的示例
检查用户是否通过 django TokenAuthentication 进行身份验证

我正在尝试使用 DRF 开发 REST APITokenAuthentication 这将在 Android 应用程序中使用我能够对用户进行身份验证并检索其令牌我现在遇到的问题是以下视图 csrf exempt def foo requ
将 blob (.bacpac) 转换为 .bacpac 文件以将数据库导入到 SQL Server Azure？

在 Azure 中使用 MVC C 时我需要从存储在 blob 存储中的 bacpac 文件恢复数据库我正在使用 DAC Framework API 从 Blob 存储访问 bacpac Issue DacServices Import
用 pandas 解析打印精美的表格数据

复制包含不同分隔符列名中的空格等的表的最佳方法是什么该函数pd read clipboard 无法自行管理此任务示例1 Age Category A B C D 21 26 2 2 4 1 26 31 7 11 12 5 31 36

用 pandas 解析打印精美的表格数据

用 pandas 解析打印精美的表格数据 的相关文章

随机推荐

热门标签

用 pandas 解析打印精美的表格数据的相关文章