Pandas 替换中的严格正则表达式

2023-12-09

我需要写一个严格的regular expression替换我的某些值pandas数据框。这是解决我发布的问题后提出的问题here.

问题是.replace(idsToReplace, regex=True)并不严格。因此,如果 iDsToReplace 是:

NY : New York
NYC : New York City

我们替换 ID 的注释是:

My cat from NYC is large.

结果响应是:

My cat from New York is large.

里面有没有Pythonic的方式pandas replace函数使regular expression匹配更严格NYC并不是NY?


Add \b for word boundaries到每个键dict:

d = {'UK': 'United Kingdom', 'LA': 'Los Angeles', 'NYC': 'New York City', 'NY' : 'New York'}

data = {'Categories': ['animal','plant','object'],
    'Type': ['tree','dog','rock'],
        'Comment': ['The NYC tree is very big', 'NY The cat from the UK is small',
                    'The rock was found in LA.']
}

d = {r'\b' + k + r'\b':v for k, v in d.items()}

df = pd.DataFrame(data)

df['commentTest'] = df['Comment'].replace(d, regex=True)
print (df)
  Categories                          Comment  Type  \
0     animal         The NYC tree is very big  tree   
1      plant  NY The cat from the UK is small   dog   
2     object        The rock was found in LA.  rock   

                                         commentTest  
0                 The New York City tree is very big  
1  New York The cat from the United Kingdom is small  
2                 The rock was found in Los Angeles.  
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 替换中的严格正则表达式 的相关文章

随机推荐

  • 让 gdb 与 emacs 24 一起工作

    经过与此相关的多次绞尽脑汁之后才意识到question that gdb似乎被打破了emacs 24 所以我已经切换到gud gdb 但我现在注意到断点上非常方便的红点似乎不起作用gud gdb 有谁对如何使用 C 代码进行明智的调试有明确
  • 嵌入的 YouTube 视频 showinfo 与适度品牌不兼容?

    我正在使用参数在我的网站上嵌入 YouTube 视频modestbranding 1 不幸的是 我也想使用参数showinfo 0 当我尝试这个时 似乎modestbranding不再起作用了 我做了研究并发现modestbranding仅
  • 如何显示用户的特定ec2实例

    我有一些 aws ec2 实例 并且只想向合作伙伴显示一个实例 我为合作伙伴创建了 IAM 用户 以下是我创建的政策 但是 当合作伙伴登录 aws 并查看 ec2 实例视图时 会显示以下消息 并且不会显示任何实例 获取实例数据时发生错误 您
  • Html / CSS:图像占据屏幕的一半

    我想创建一个网页 其中一个大图像占据屏幕的一半 如下所示 我怎样才能用 CSS 做到这一点 尝试这样的事情吗 2个分区 leftHalf background url bg 1 jpg width 50 position absolute
  • 从 Java 读取 Windows ACL

    在 Java 程序中 我希望能够列出有权读取给定文件的 Windows 用户和组 Java 没有内置的功能来读取 Windows ACL 信息 至少直到Java 7 所以我正在寻找其他解决方案 是否有任何第三方库可以提供对 Windows
  • 使用 GhostscriptProcessor 创建 PDF/A

    我想使用 GhostscriptProcessor 将 PDF 文件转换为 PDF A 但结果是 PDF 而不是 PDF A GhostscriptProcessor gsproc new GhostscriptProcessor Prop
  • 在 Centos 7.4x 上将 OSSubprocess 添加到我的 Pharo 6.1 时出现错误

    我想搞乱OSSubprocess 由马里亚诺 马丁内斯 佩克 来自 CentOS 7 4 上的 Pharo 6 1 我在 内搜索了Pharo Project Catalog并尝试安装它 我收到一个错误 ioLoadModule home s
  • 防止派生类隐藏基类中的非虚函数

    考虑一下我有 A 类和 B 类 这样 class A public void Fun class B public A 作为 A 类的设计者 有什么方法可以强制派生类 B 和从 A 派生的其他类被阻止 出现某种错误 隐藏非虚函数 Fun 吗
  • 如何将值传递到 MVC3 母版页 (_layout)?

    我有一个自定义 modelbinder 它检查身份验证 cookie 并返回值 public class UserDataModelBinder
  • 在cocos2d引擎中实现QR阅读器

    到目前为止 我正在使用 cocos2d 引擎创建一个游戏 我想实现一个 QR 阅读器 到目前为止 我已经创建了一个 CCScene CCScene 有一个菜单按钮 它指向一个 onScan 方法 void onScan id sender
  • 如何使用 Inno Setup 检测并“修复”DPI 设置?

    我创建了一个带有自定义向导页面和自定义背景图像的设置 问题出在非标准 DPI 系统上 当我运行此设置时 背景图像无法正确显示 如何检测 DPI 大小并使用向导页面的自定义设置 最正确 的方法是为小字体和大字体模式提供替代图像 不太正确 的方
  • 从 dropbox API 构建目录树

    我想要做的是使用 python 绑定 从 dropbox API 为给定路径构建一棵树 并为每个路径提供共享链接 我建议的结构看起来像这样 path a is dir True contents path a b is dir True c
  • 如何将 ViewModel 本地化添加到 Blazor?

    我们都知道 Blazor 中缺乏 ViewModel 本地化 今天我尝试了很多方法 我想出了一个很好的方法来应用本地化 DataAnnotations验证可能不是实现此目的的最佳方法 因为验证逻辑与类相关联 正如您在自己的答案中看到的那样
  • 最新的“ADT BUNDLE”作为 Windows 7 64 位的 JUNO eclipse 打开

    我下载了最新的 adt 包 adt bundle windows x86 64 20140624 并解压缩了该 zip 文件 但是当我尝试打开该 adt 时 它以 juno eclipse 的形式打开 任何人都可以帮助我解决这个问题 提前致
  • Oracle SQL。获取两个日期之间的日期

    我有一个包含两个日期列的表 如何获取这两个日期之间的日期并将它们一一列出 这是测试脚本 CREATE TABLE t1 AS SELECT DATE 2020 1 31 AS startdate DATE 2020 2 3 AS endda
  • 如何通过在Python中的分隔符上拆分键来从字典创建嵌套字典?

    我有一个如下的字典 a customer name bob customer phone 555 1212 order 0 number A33432 24 order 0 date 12 12 12 order 1 number asd2
  • 如何使用 SOAP Web 服务并在 Windows Phone 应用程序中显示数据

    我正在为 Windows 应用程序构建我的第一个应用程序 我的要求是 单击按钮时我想导航到另一个页面 并且在该页面中我希望通过执行 xml 解析直接从肥皂网络服务显示数据 按钮事件代码 private void button1 Click
  • 如何在tensorflow中将字典转换为张量

    这是我的字典 docs computer 1 1 3 5 8 2 politics 0 2 1 2 3 1 我想创建一个9 2 tensor像这样 0 1 0 5 0 0 0 0 2 2 2 0 1 0 0 0 0 0 0 在这里 因为最大
  • 字典或 If 语句、Jython

    我现在正在编写一个脚本 它将使用 dom4j 从 HTML 中获取某些信息 由于 Python Jython 没有原生的switch声明我决定使用一大堆if调用适当方法的语句 如下所示 if type extractTitle extrac
  • Pandas 替换中的严格正则表达式

    我需要写一个严格的regular expression替换我的某些值pandas数据框 这是解决我发布的问题后提出的问题here 问题是 replace idsToReplace regex True 并不严格 因此 如果 iDsToRep