使用以正则表达式作为键的字典进行多个正则表达式替换

2023-11-29

我想使用多个正则表达式对字符串进行多次替换。我还想在一次传递中进行替换,以避免创建字符串的多个实例。

假设对于参数,我想进行下面的替换,同时避免多次使用 re.sub(),无论是显式使用还是循环使用:

import re

text = "local foals drink cola"
text = re.sub("(?<=o)a", "w", text)
text = re.sub("l(?=a)", "co", text)

print(text) # "local fowls drink cocoa"

我找到的最接近的解决方案是从替换目标字典中编译正则表达式,然后使用 lambda 函数将每个匹配的目标替换为字典中的值。但是,这种方法在使用元字符时不起作用,因此删除了本示例中正则表达式所需的功能。

让我首先用一个无需元字符的示例来演示:

import re

text = "local foals drink cola"

subs_dict = {"a":"w", "l":"co"}
subs_regex = re.compile("|".join(subs_dict.keys()))
text = re.sub(subs_regex, lambda match: subs_dict[match.group(0)], text)

print(text) # "coocwco fowcos drink cocow"

现在观察将所需的元字符添加到字典键会导致 KeyError:

import re

text = "local foals drink cola"

subs_dict = {"(?<=o)a":"w", "l(?=a)":"co"}
subs_regex = re.compile("|".join(subs_dict.keys()))
text = re.sub(subs_regex, lambda match: subs_dict[match.group(0)], text)

>>> KeyError: "a"

原因是 sub() 函数正确地找到了表达式的匹配项"(?<=o)a",所以现在必须在字典中找到它以返回其替换,但是提交用于字典查找的值match.group(0)是对应的匹配字符串"a"。搜索也不起作用match.re在字典中(即产生匹配的表达式),因为它的值是从字典键编译的整个不相交表达式(即"(?<=o)a|l(?=a)").

编辑:如果有人会受益于看到 thejonny 的解决方案使用 lambda 函数实现,尽可能接近我的原始版本,它会像这样工作:

import re

text = "local foals drink cola"

subs_dict = {"(?<=o)a":"w", "l(?=a)":"co"}
subs_regex = re.compile("|".join("("+key+")" for key in subs_dict))

group_index = 1
indexed_subs = {}
for target, sub in subs_dict.items():
    indexed_subs[group_index] = sub
    group_index += re.compile(target).groups + 1

text = re.sub(subs_regex, lambda match: indexed_subs[match.lastindex], text)

print(text) # "local fowls drink cocoa"

如果您想要使用的表达式没有与空字符串匹配(如果您想要替换,这是一个有效的假设),您可以在之前使用组|分析表达式,然后检查哪个组找到了匹配项:

(exp1)|(exp2)|(exp3)

或者可能是命名组,这样您就不必计算子表达式内的子组。

替换功能可以查看哪个组匹配,并从列表中选择替换。

我想出了这个实现:


import re
def dictsub(replacements, string):
    """things has the form {"regex1": "replacement", "regex2": "replacement2", ...}"""
    exprall = re.compile("|".join("("+x+")" for x in replacements))
    gi = 1
    replacements_by_gi = {}
    for (expr, replacement) in replacements.items():
        replacements_by_gi[gi] = replacement
        gi += re.compile(expr).groups + 1


    def choose(match):
        return replacements_by_gi[match.lastindex]

    return re.sub(exprall, choose, string)


text = "local foals drink cola"
print(dictsub({"(?<=o)a":"w", "l(?=a)":"co"}, text))


打印local fowls drink cocoa

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用以正则表达式作为键的字典进行多个正则表达式替换 的相关文章

  • Python 中的自然日/相对日

    我想要一种在 Python 中显示日期项目的自然时间的方法 类似于 Twitter 将显示 刚才 几分钟前 两小时前 三天前 等消息 Django 1 0 在 django contrib 中有一个 人性化 方法 我没有使用 Django
  • 我应该将Python的pyc文件添加到.dockerignore吗?

    我见过几个例子 dockerignorePython 项目的文件 其中 pyc文件和 或 pycache 文件夹被忽略 pycache pyc 由于无论如何这些文件 文件夹都会在容器中重新创建 我想知道这样做是否是一个好习惯 是的 这是一个
  • 如何使用列表理解从列表中删除重复的项目? [复制]

    这个问题在这里已经有答案了 如何使用列表理解从列表中删除重复的项目 我有以下代码 a 1 2 3 3 5 9 6 2 8 5 2 3 5 7 3 5 8 b b item for item in a if item not in b 但它不
  • 如何获取一个类的所有实例

    我是一名初学者 正在学习 Python 我想创建一个课程Person 在构造函数中 我想将我创建的每个实例放入一个名为 实例 的集合中 然后我希望实例 方法返回所有实例 我怎样才能做到这一点 class Person Type annota
  • python下安装xgboost 32位msys失败

    尝试安装 xgboost 失败 Windows 和企业版版本为 Anaconda 2 1 0 64 位 我该如何继续 我一直在使用 R 似乎从 RStudio 在 R 中安装新包相当容易 但在间谍程序中则不然 因为我需要进入命令窗口来执行此
  • 带剖面的 3D 曲面图

    基本上 我有一个由一组时间序列组成的曲面图 我想在特定高度添加剖面图 以更好地了解一年中值高于所选阈值的时期 由此 其中显示平面但不是剖面 To This 有什么建议吗 使用 alpha 和相机仰角并没有解决问题 平面似乎仍然在人物的前面
  • 使用 Python 将 Json 转换为换行 Json 标准

    我有一个获取嵌套对象并删除所有嵌套的代码 使对象平坦 def flatten json y param y Unflated Json return Flated Json out def flatten x name if type x
  • 使用字符串迭代 url - python

    我现在完全被我的代码困住了 首先 我尝试从 volkskrant 的存档页面检索所有网址 这是我被打击的第一步 某一特定日期的 url 如下所示 http www volkskrant nl archief detail 01012016
  • Python 结构的 PHP 替代品

    我很高兴在我的 Python 项目中使用 Fabric 进行部署 现在我正在从事一个更大的 PHP 项目 想知道是否有类似 PHP 的 Fabric 之类的东西 唔 为什么这有关系 Fabric 只是 python 脚本 所以它与项目语言无
  • django 密码重置功能中出现 NoReverseMatch 错误

    我正在尝试在 django 中实现密码重置功能 下面是我的代码 urls py urlpatterns patterns url r signup accounts views signup name signup email url r
  • 有人能给我一个 1 到 5 之间数字的正则表达式吗

    有人能给我一个 1 到 5 之间的单个数字的正则表达式吗 例如输入必须是 1 到 5 之间的数字 55 或 23 不匹配 尝试使用anchors http www regular expressions info anchors html
  • 从 SQL 数据库导入表并按日期过滤行时,将 Pandas 列解析为日期时间

    我有一个DataFrame列名为date 我们如何将 日期 列转换 解析为DateTime object 我使用 Postgresql 数据库加载日期列sql read frame 的一个例子date列是2013 04 04 我想做的是选择
  • python 3 configparser.read() 在给定不存在的文件时不会引发异常

    当我尝试使用 configparser read 读取不存在的文件时 我认为它应该引发异常 事实并非如此 它返回一个空列表 显然 我可以测试空列表并引发异常 在我看来 如果 configparser read 引发 FileNotFound
  • 正则表达式(第一个字符匹配 a-z)

    我有这个正则表达式 a zA Z0 9 上面我想补充的是 第一个字符只能是a zA Z 我怎样才能制作这个正则表达式 尝试这样的事情 a zA Z a zA Z0 9 解释 Start of line string a zA Z Chara
  • 在 envoy 中使用 rm *(通配符):没有这样的文件或目录

    我正在使用 Python 和 Envoy 我需要删除目录中的所有文件 除了一些文件外 该目录是空的 在终端中 这将是 rm tmp my silly directory 常识表明 在特使中 这转化为 r envoy run rm tmp m
  • 请解释*贪婪量词的工作原理

    Pattern ptn Pattern compile a Matcher mtch ptn matcher bbaac if mtch find System out println mtch group 输出 不打印任何内容 Patte
  • Python 3d 金字塔

    我是 3D 绘图新手 我只想用 5 个点建造一个金字塔并通过它切出一个平面 我的问题是我不知道如何填充两侧 points np array 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 fig plt figure ax fi
  • python nltk从句子中提取关键字

    我们要做的第一件事 就是杀掉所有律师 威廉 莎士比亚 鉴于上面的引用 我想退出 kill and lawyers 作为两个突出的关键词来描述句子的整体含义 我提取了以下名词 动词 POS 标签 First NNP thing NN do V
  • Python DNS服务器IP地址查询

    我正在尝试使用 python 获取 DNS 服务器 IP 地址 要在 Windows 命令提示符下执行此操作 我将使用 ipconfig 全部 如下所示 我想使用 python 脚本做同样的事情 有什么方法可以提取这些值吗 我成功提取了设备
  • 如何将 pygame Surface 转换为 PIL 图像?

    我正在使用 PIL 来透视地变换屏幕的一部分 原始图像数据是一个 pygame Surface 需要转换为 PIL 图像 因此我发现了 pygame 的 tostring 函数就是为了这个目的而存在的 然而结果看起来很奇怪 见附图 这段代码

随机推荐

  • 使用 gnuplot 绘制两个相邻的“带框”图

    我试图将两个数据系列绘制在一张图中 作为 gnuplot 中的方框 该脚本目前如下所示 set terminal postscript eps enhanced color set title Distribution of the ext
  • C++:调用派生类的虚函数

    假设我有一个带有虚函数的类和一个以不同方式实现该虚函数的派生类 假设我还有一个用于存储派生类的基类向量 如果事先不知道派生类是什么 我将如何在向量中执行派生类的虚函数 说明问题的最少代码 include
  • 如何在任意 Java 应用程序中启用抗锯齿功能?

    尽管 Swing 能够提供抗锯齿字体 但许多 Java 应用程序默认情况下并不使用抗锯齿字体 如何强制任意 Java 应用程序使用 AA 字体 适用于我正在运行的应用程序和我正在开发的应用程序 如果您有权访问源代码 则可以在 main 方法
  • 创建色轮的功能[关闭]

    Closed 这个问题需要多问focused 目前不接受答案 这是我多次伪解决但从未完全找到解决方案的问题 问题是想出一种方法来生成N颜色 尽可能区分N是一个参数 我对此的第一个想法是 如何在空间中生成 N 个向量 使彼此之间的距离最大化
  • 单元格悬停时的工具提示图像,Google 电子表格

    我目前正在制作一个必须包含大量图像引用的 Google 电子表格 我想要实现的是 当您将鼠标悬停在单元格上时 会出现图像 如工具提示 I found 这个小部件在 Google Developers 上 但是当我将代码添加到电子表格时什么也
  • IE9 下的 FakeSmile

    我正在尝试在 IE9 中伪造 SMIL 支持假笑 我动态创建 SVG 元素 添加带有 animate 元素的 rect 元素并调用 beginElement IE9 给我一个错误 对象不支持属性或方法 beginElement 静态 SVG
  • 在数据库中存储标签的最有效方法是什么?

    我正在我的网站上实现一个类似于 stackoverflow 使用的标签系统 我的问题是 存储标签以便搜索和过滤标签的最有效方法是什么 我的想法是这样的 Table Items Columns Item ID Title Content Ta
  • 无法在运行时修改mapred.job.name。它不在允许在运行时修改的参数列表中

    我正在尝试在气流中运行一些蜂巢作业 我建立了custome jdbc 连接 您可以在图中看到 我可以通过 Airflow Web ui 查询 Hive 表 数据分析 gt 即席查询 我还想运行一些来自互联网的示例 dag 文件 File N
  • “is”运算符未按预期工作

    看看这段代码 import re ti abcd tq abcdef check abcd re compile abcd print id check abcd search ti print id check abcd search t
  • 检查 Javascript 函数接受多少个参数?

    With arguments length我可以看到有多少参数传递给函数 但是有没有办法确定一个函数可以接受多少个参数 以便我知道应该传入多少个参数 Function length会完成这项工作 在我看来真的很奇怪 function tes
  • tkinter.TclError:图像“pyimage3”不存在

    我在使用一个在屏幕上显示图像两秒钟然后被破坏的函数时遇到问题 当程序运行时 函数初始调用程序正常工作 但如果随后通过 tkinter 中内置的按钮调用该函数 则会出现错误 appcwd os getcwd user32 ctypes win
  • mvc 大写模型 vs 小写模型

    我正在开发一个 MVC 5 项目 对 MVC 来说非常陌生 我注意到代码中的这一行 Html DropDownListFor model gt model ContractorId Model Contractors 页面顶部的指令是 mo
  • 我可以更改之前所有提交中的姓名吗?

    我想在我的所有提交中更改我的名字 姓氏和电子邮件 可以吗 Use git filter branch git filter branch commit filter if GIT AUTHOR NAME Josh Lee then expo
  • 从高于最低要求的 API 级别调用 API

    我编写的应用程序的大部分内容都很好 最低 API 级别设置为 7 我想从级别 8 调用单个 API 使用较低版本 Android 的用户将在没有此 额外功能 的情况下生存 目前我添加了 SuppressLint NewApi 这样我的代码就
  • 如何从 C 方法调用 Objective-C 方法?

    我有一个 Obj C 对象 里面有很多方法 有时一个方法需要调用同一对象内的另一个方法 我似乎不知道如何让 C 方法调用 Obj C 方法 WORKS Obj C 方法调用 Obj C 方法 self objCMethod WORKS Ob
  • c++ 两种数组声明方法之间的区别

    在 C 中声明数组 并为它们分配内存 的可能多种方法中的两种 1 int a 3 2 int b new int 3 我想了解 c 如何以不同的方式对待这两者 A 在这两种情况下 我都可以使用以下语法访问数组 a 1 and b 1 b 当
  • 如何在批处理文件中从txt文件创建数组?

    我有一个包含以下数据的 txt 文件 aaaa 1000 2000 bbb 3000 4000 cccc 5000 ddd 6000 7000 8000 该文件中的行数不固定 我需要数组中每行的第一个标记并打印每个元素 创建数组 setlo
  • ActiveRecord 上的 to_json 时跳过具有 nil 值的属性

    我想知道是否有任何方法可以跳过具有 nil 的属性 ActiveRecord 上 to json 时的值 默认行为是包含 nil 值 有没有一种方法可以让这个值不出现 lars 的答案适用于单个对象 但对于 Active Record 对象
  • 以编程方式将新列添加到 DataGridView

    我有一个绑定到 DataTable 的 DataGridView DataTable 由数据库查询填充 该表包含一个名为 BestBefore 的列 BestBefore 是格式化为字符串的日期 SQLite 没有日期类型 我想以编程方式向
  • 使用以正则表达式作为键的字典进行多个正则表达式替换

    我想使用多个正则表达式对字符串进行多次替换 我还想在一次传递中进行替换 以避免创建字符串的多个实例 假设对于参数 我想进行下面的替换 同时避免多次使用 re sub 无论是显式使用还是循环使用 import re text local fo