Python pandas 在数据框中拆分文本和数字

2023-11-29

我有一个数据框 df1,其列名称 Acc Number 作为第一列,数据如下所示:

Acc Number
ASC100.1
MJT122
ASC120.4
XTY111

我需要创建一个新的数据框 df2 ,它有两列,第一列包含文本部分,第二列包含数字,因此所需的输出是:

Text    Number 
ASC     100.1
MJT     122
ASC     100.4
XTY     111

我该怎么做呢?

Thanks!


你可以这样做:

import pandas as pd

data = ['ASC100.1',
'MJT122',
'ASC120.4',
'XTY111']

df = pd.DataFrame(data=data, columns=['col'])

result = df.col.str.extract('([a-zA-Z]+)([^a-zA-Z]+)', expand=True)
result.columns = ['Text', 'Number']
print(result)

Output

  Text Number
0  ASC  100.1
1  MJT    122
2  ASC  120.4
3  XTY    111

图案([a-zA-Z]+)([^a-zA-Z]+)表示匹配一组字母:([a-zA-Z]+)后面跟着一组非字母:([^a-zA-Z]+)。更安全的替代方法是使用以下正则表达式:([a-zA-Z]+)(\d+\.?\d+)假设数字最多只能有一个点。

Further

  1. 有关的文档regex在Python中。
  2. 有关的文档extract.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python pandas 在数据框中拆分文本和数字 的相关文章

随机推荐

  • 用于验证字符串中括号的 JS 函数

    伙计们 我想问你如何创建一个函数来检查字符串中的括号是否正确放置 例如 a b 4 2 c 5 我必须检查括号 我尝试了一些方法 但似乎不起作用 抱歉 我是 javascript 的新手 function checkBrackets str
  • 如何将文件从独立存储复制到下载文件夹?

    我正在尝试将数据库文件从独立存储复制到下载文件夹 或用户可以访问的任何文件夹 目前我的数据库存储在 data user 0 com companyname appname files Databases MyDatabase db 我尝试使
  • 无法删除 JTextPane 中 html 内容的额外行距

    我无法将 Java 中的行挤在一起JTextPane如果我将内容类型设置为text html 我希望它们像内容类型一样紧密地结合在一起text plain 默认值 The line height top margin CSS 属性似乎没有帮
  • PHP 如何将对象数组与数组数组合并

    首先 抱歉冗长的解释 我在 PHP 中有两个数组 第一个数组是对象数组 第二个数组是数组的数组 基本上 我想循环遍历并将对象与其匹配的数组合并 然后返回合并的对象 请参阅以下内容print r 对象结构数组 Array 0 gt stdCl
  • 在 Azure Blob 存储上上传大文件时“流太长”

    我尝试将大文件 4Gb 上传到 Azure Blob 存储 但失败 根据这篇文章 https learn microsoft com en us azure storage storage dotnet how to use blobs 这
  • Excel/VBA - 如果网络连接不存在则中止脚本

    是否有任何 VBA 代码可以查找当前的互联网连接 我有一个将在计时器上运行的代码 此代码将打开本地网络共享驱动器上的文件 我正在寻找某种类型的 On Error Goto ErrorMessage 代码 如果它在网络未连接时尝试打开文件 您
  • Marshal (Ruby) 管道:将序列化对象发送到子进程

    我需要使用 Marshal 序列化 Ruby 中的对象 并通过管道将其发送到子进程 我怎样才能做到这一点 我的代码如下所示 我的问题在评论中 data Marshal dump data call sub process ruby r a
  • SQL 作业存在事务日志问题

    我有一个仅执行存储过程的 SQL 作业 每天早上当作业尝试运行时 我都会收到以下错误 当前事务无法提交 并且无法支持写入日志文件的操作 当我继续尝试重新启动作业时 它总是给我同样的错误 但是 如果我只是执行存储过程而不使用作业 它就可以正常
  • 如何在 Rails 4 中格式化 db:datetime 记录中的时间和日期?

    我有一个var在我看来 返回日期和时间datetime数据库记录为 UTC 格式 输出如下所示 2014 01 21 03 13 59 UTC 我该如何格式化它 Date parse var 会给 gt Tue 21 Jan 2014在 I
  • 与 DrawText 函数冲突

    我正在开发一个多平台应用程序 在一个组件中我有一个名为 DrawText 的类方法 不幸的是 我收到一个链接器错误 仅在 Windows 上 指出此类的 DrawTextW 方法存在未解析的外部符号 我之前见过以 Text 结尾的其他方法
  • 将值从一种形式传递到另一种形式

    我有两个表单 我需要将值从 form1 textbox1 传递到 form2 variable Form1 string Ed En public string En1 get return En set En value public s
  • 包裹在 Horizo​​ntalScrollView 中的 TabWidget 不随 ViewPager 滚动

    我必须使用TabHost代替ActionBarTabs为了使它们可以滚动 我已经包裹了我的TabWidget in a HorizontalScrollView 但是HorizontalScrollView不按照以下方式自行滚动ViewPa
  • Slowcheetah 已安装,但没有转换选项

    我在 Visual Studio 2013 中有一个使用 MVC 5 和 EF 6 的 NET 4 5 项目 我想要对 app config 进行转换 I ve installed the SlowCheetah project via N
  • 为矩阵的每一行查找 5 个连续的数字 >= 3

    我有以下矩阵 mdat lt matrix c 6 2 4 4 5 1 6 2 1 5 1 3 3 5 4 5 1 4 2 2 4 3 4 4 4 4 3 3 1 1 3 2 3 3 3 3 3 2 2 2 1 2 2 2 2 2 1 1
  • Chrome 开发者工具中的 Websocket

    目前正在与Socket IO使用网络套接字 我有几个关于如何在 chrome devtools 中解释 websockets 的问题 当我们在 chrome 中得到以下输出时 问题 该方法仍然由HTTPget 方法动词 难道是因为这个HTT
  • 在 Altair 中生成“闪避”或“并排”条形图/柱形图?

    如果之前有人问过这个问题 我深表歉意 但我正在寻找一种方法来创建 躲避 的条形图 language from ggplot2 在 python 中使用 Altair 库 我知道 Altair 有这个例子 import altair as a
  • 将逗号分隔值转换为多行

    我有一个这样的表 ID NAME Dept ID 1 a 2 3 2 b 3 c 1 2 Department 是另一个以 dept id 和 dept name 作为列的表 我想要的结果是 ID Name Dept ID 1 a 2 1
  • 自包含数据库?

    有没有一种方法可以将 小型 独立的关系数据库与 Windows 应用程序一起分发 而不需要用户安装其他依赖项 例如 MS Access SQL Server MySQL SQLite 等 只有应用程序将访问数据库 而不是用户直接访问 微软
  • 使用 google calendar api 时,Android 给出 IOException 并显示“无法创建目录:/tokens”

    尝试将日历快速入门 API 实现到 Android 中 但是当我声明令牌时 如图所示 private final String TOKENS DIRECTORY PATH tokens 然后在构建器中使用该字符串 GoogleAuthori
  • Python pandas 在数据框中拆分文本和数字

    我有一个数据框 df1 其列名称 Acc Number 作为第一列 数据如下所示 Acc Number ASC100 1 MJT122 ASC120 4 XTY111 我需要创建一个新的数据框 df2 它有两列 第一列包含文本部分 第二列包