在 pandas 数据框替换功能中使用正则表达式匹配组

2024-02-01

我刚刚学习 python/pandas，喜欢它的强大和简洁。

在数据清理期间，我想使用正则表达式对数据框中的列进行替换，但我想重新插入匹配的部分（组）。

简单示例：姓氏、名字 -> 名字姓氏

我尝试了类似以下的内容（实际情况更复杂，所以请原谅简单的正则表达式）：

df['Col1'].replace({'([A-Za-z])+, ([A-Za-z]+)' : '\2 \1'}, inplace=True, regex=True)

但是，这会导致空值。匹配部分按预期工作，但值部分则不然。我想这可以通过一些拆分和合并来实现，但我正在寻找关于正则表达式组是否可以用于替换的一般答案。

我认为您对正则表达式有一些问题。

As @阿卜杜刚刚说过 https://stackoverflow.com/questions/41472951/using-regex-matched-groups-in-pandas-dataframe-replace-function/41473130#comment70152014_41472951使用任一'\\2 \\1'或更好r'\2 \1', as '\1'是带有ASCII码的符号1

如果您使用正确的正则表达式，您的解决方案应该有效：

In [193]: df
Out[193]:
              name
0        John, Doe
1  Max, Mustermann

In [194]: df.name.replace({r'(\w+),\s+(\w+)' : r'\2 \1'}, regex=True)
Out[194]:
0          Doe John
1    Mustermann Max
Name: name, dtype: object

In [195]: df.name.replace({r'(\w+),\s+(\w+)' : r'\2 \1', 'Max':'Fritz'}, regex=True)
Out[195]:
0            Doe John
1    Mustermann Fritz
Name: name, dtype: object

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

在 pandas 数据框替换功能中使用正则表达式匹配组的相关文章

DataFrame 在函数内部修改

我面临一个我以前从未观察到的函数内数据帧修改的问题有没有一种方法可以处理这个问题以便初始数据帧不被修改 def test df df tt np nan return df dff pd DataFrame data 现在当我打印时d
底图上的子图

我有一张英国地图和 121 个地点每个地点有 3 个值我想绘制 121 个位置中每个位置的三个值的小条形图目前这些值绘制为markersize属性看起来像这样密集恐惧症情节 https i stack imgur com 5fv
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
conda 无法从 yml 创建环境

我尝试运行下面的代码来从 YAML 文件创建虚拟 Python 环境我在 Ubuntu 服务器上的命令行中运行代码虚拟环境名为 py36 当我运行下面的代码时我收到下面的消息环境也没有被创建这个问题是因为我有几个必须使用 pip
如何从谷歌云存储桶读取音频文件并在datalab笔记本中使用ipd播放

我想在数据实验室笔记本中播放我从谷歌云存储桶中读取的声音文件这个怎么做 import numpy as np import IPython display as ipd import librosa import soundfile as
字典中的列表，Python 中的循环

我有以下代码 TYPES hotmail type hotmail lookup mixed dkim no signatures S Return Path email protected cdn cgi l email protecti
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
Python 正则表达式部分匹配或“hitEnd”

我正在编写一个扫描器因此我将任意字符串与正则表达式规则列表进行匹配如果我可以模拟 Java hitEnd 功能不仅知道正则表达式何时不匹配还知道何时匹配这将非常有用 can t匹配当正则表达式匹配器在决定拒绝输入之前到达输入末尾
Python正则表达式从字符串中获取浮点数

我正在使用正则表达式来解析字符串中的浮点数 re findall a zA Z d d t 是我使用的代码这段代码有问题如果数字和任何字符之间没有空格则不会解析该数字例如 0 1 2 3 4 5 6 7 8 9 的预期输出为 0 1
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
如何获得没有前缀的虚拟人物？

我想从两个不同的列中获取虚拟数据但没有任何前缀资料说明 X Y 123 AAA 456 BBB 123 AAA 789 CCC 预期结果 X Y 789 456 123 CCC BBB AAA 123 AAA 0 0 1 0 0 1 4
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
从另一个 python 脚本获取返回信息

我在 Linux 上我有一个 python 脚本我想从另一个 python 脚本调用它我不想将其作为模块导入为了一层安全性现在为了学术练习因为我想弄清楚这一点我实际上想让一个脚本使用 os system 或另一个类似的函数并
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi
在 Python 的 Textmate 中突出显示尾随空格？

我想做类似的事情this http remysharp com 2008 03 30 trailing white space in textmate Textmate 提示这样当我在 Python 中编写代码时尾随空白总是以某种方式突
issubclass() 对从不同路径导入的同一类返回 False

目的是实现某种插件框架其中插件是同一基类即 A 的子类即 B 基类使用标准导入加载而子类使用 imp load module 从众所周知的包即 pkg 的路径加载 pkg init py mod1 py class A mod2
Python 枚举子集迭代

我想迭代以下枚举的子集 class Items enum Enum item1 0 item2 1 item3 2 item4 3 item5 4 item6 5 item7 6 item8 7 说我想 for item in Items
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client

随机推荐

如何解压方法参数来为其分配类属性？

我经常做这样的事情 class Box def init self some setup stuff def configure self color ffffff weight 1 empathy 97 angle x 0 angle y
使用 Glide 库显示模糊图像

我正在尝试使用显示模糊图像Glide而是显示错误图像我不知道为什么显示错误图像 URL工作正常但仍然仅显示错误图像这是我的代码 Glide with context load http www gadgetsaint com wp c
如何解决此错误命令 PhaseScriptExecution 失败并出现非零退出代码

I hade changed my Mac to MacBook m1 and my Xcode V is 12 4 my project run normally on simulator but doesn t on the real
如何从列表中删除整数？ [复制]

这个问题在这里已经有答案了我需要从整数数组列表中删除整数我对字符串和其他对象没有问题但是当我删除时整数被视为索引而不是对象 List
使用 d3.js 绘制半实心圆

我正在尝试用 d3 js 创建一个半实心圆就像this http www indezine com products powerpoint learn shapes images halfcirles2010 8 jpg 我没有找到任何如
如何捕获 Javascript 中的 404 错误？

我有一个 HTML 音频元素并且我将该元素的 src 属性动态设置为存储在局域网上的音频文件它是这样工作的 function setSource source audio src source var audio new Audio v
如何在 C 中使用 printf() 和 scanf() 而不进入下一行？

我想在一行中获取出生日期 include
删除重复的尾部斜杠

我想检测php如果一个字符串像 string包括重复的尾部斜杠例如 string http somepage com something some html to string http somepage com something so
在 iOS 上使用 Cordova 1.6 设置外部起始页

是否可以加载外部index html 包含cordova js 而不是本地index html 我在 appdelegate m 中找到了这段代码 self viewController wwwFolderName www self vie
如何在 NodeJs 中安排 Google 会议并获取会议链接？

在我的项目中我必须在给定时间在两个用户之间安排一次谷歌会议我在 NodeJS 中拥有其电子邮件 ID 有人能帮我解决这个问题吗您将需要使用谷歌日历API https developers google com calendar api
使用 BlueSnap 托管支付字段轻松开始；

您好我正在寻找一个可以复制并粘贴到我的网站中的简单脚本以便我可以开始使用 BlueSnap 的 HPF 字段进行销售该表单应包括取回代币并向购物者收费所需的最基本元素我不是在寻找任何设计只是在寻找功能我有基础知识但我需要看看如
xml解析-代码重构问题

我有以下 xml
使用 rxjs 处理刷新令牌

自从我开始使用 angular2 以来我已经设置了我的服务来返回 T 的 Observable 在服务中我将进行 map 调用并且使用这些服务的组件将仅使用 subscribe 来等待响应对于这些简单的场景我真的不需要深入研究 r
从 JavaScript 加载图像

在我的 Grails 应用程序中我有一个目录web app images carousel slides包含以下文件 foo png foo thumbnail png bar png bar thumbnail png 我的应用程序正在
如何以惯用的方式计算有多少元素满足条件？

有了这些数据 gt data 1 1290603356 1290603360 1290603350 1290603344 1290603340 1290603373 7 1290603354 1290603359 1290603345 12
QGLWidget 在 Mac OS X Lion 下无法正常工作

正如你所看到的我不知道为什么它根本不起作用 When the program run it will look like this 我正在使用 macports 的 qt4 mac v4 8 2 看来该包是预编译的这是来源主要 cpp
控制器中的 GGTS 重复方法名称/签名错误

我正在使用基于 eclipse 4 3 1 64 位版本的最新 GGTS v3 4 在 Grails 2 3 2 上开发应用程序我的类路径中的每个控制器都有一个错误每个控制器类都有两个相同的错误 Groovy 类 package Som
django 模板中的逗号分隔列表

If fruits是列表 apples oranges pears 有没有一种使用 django 模板标签快速生成苹果橙子和梨的方法 I know it s not difficult to do this using a loop
如何处理函数数组中的重复函数调用？

我正在尝试按顺序执行以下函数同步异步数组避免callbackHell 实现函数runCallbacksInSequence 我需要实现自己的函数来了解回调的工作原理并避免使用 Async js 这是我到目前为止所拥有的功能runC
在 pandas 数据框替换功能中使用正则表达式匹配组

我刚刚学习 python pandas 喜欢它的强大和简洁在数据清理期间我想使用正则表达式对数据框中的列进行替换但我想重新插入匹配的部分组简单示例姓氏名字 gt 名字姓氏我尝试了类似以下的内容实际情况更复杂所以请原谅简

在 pandas 数据框替换功能中使用正则表达式匹配组

在 pandas 数据框替换功能中使用正则表达式匹配组 的相关文章

随机推荐

热门标签

在 pandas 数据框替换功能中使用正则表达式匹配组的相关文章