使用以正则表达式作为键的字典进行多个正则表达式替换

2023-11-29

我想使用多个正则表达式对字符串进行多次替换。我还想在一次传递中进行替换，以避免创建字符串的多个实例。

假设对于参数，我想进行下面的替换，同时避免多次使用 re.sub()，无论是显式使用还是循环使用：

import re

text = "local foals drink cola"
text = re.sub("(?<=o)a", "w", text)
text = re.sub("l(?=a)", "co", text)

print(text) # "local fowls drink cocoa"

我找到的最接近的解决方案是从替换目标字典中编译正则表达式，然后使用 lambda 函数将每个匹配的目标替换为字典中的值。但是，这种方法在使用元字符时不起作用，因此删除了本示例中正则表达式所需的功能。

让我首先用一个无需元字符的示例来演示：

import re

text = "local foals drink cola"

subs_dict = {"a":"w", "l":"co"}
subs_regex = re.compile("|".join(subs_dict.keys()))
text = re.sub(subs_regex, lambda match: subs_dict[match.group(0)], text)

print(text) # "coocwco fowcos drink cocow"

现在观察将所需的元字符添加到字典键会导致 KeyError：

import re

text = "local foals drink cola"

subs_dict = {"(?<=o)a":"w", "l(?=a)":"co"}
subs_regex = re.compile("|".join(subs_dict.keys()))
text = re.sub(subs_regex, lambda match: subs_dict[match.group(0)], text)

>>> KeyError: "a"

原因是 sub() 函数正确地找到了表达式的匹配项"(?<=o)a"，所以现在必须在字典中找到它以返回其替换，但是提交用于字典查找的值match.group(0)是对应的匹配字符串"a"。搜索也不起作用match.re在字典中（即产生匹配的表达式），因为它的值是从字典键编译的整个不相交表达式（即"(?<=o)a|l(?=a)").

编辑：如果有人会受益于看到 thejonny 的解决方案使用 lambda 函数实现，尽可能接近我的原始版本，它会像这样工作：

import re

text = "local foals drink cola"

subs_dict = {"(?<=o)a":"w", "l(?=a)":"co"}
subs_regex = re.compile("|".join("("+key+")" for key in subs_dict))

group_index = 1
indexed_subs = {}
for target, sub in subs_dict.items():
    indexed_subs[group_index] = sub
    group_index += re.compile(target).groups + 1

text = re.sub(subs_regex, lambda match: indexed_subs[match.lastindex], text)

print(text) # "local fowls drink cocoa"

如果您想要使用的表达式没有与空字符串匹配（如果您想要替换，这是一个有效的假设），您可以在之前使用组|分析表达式，然后检查哪个组找到了匹配项：

(exp1)|(exp2)|(exp3)

或者可能是命名组，这样您就不必计算子表达式内的子组。

替换功能可以查看哪个组匹配，并从列表中选择替换。

我想出了这个实现：


import re
def dictsub(replacements, string):
    """things has the form {"regex1": "replacement", "regex2": "replacement2", ...}"""
    exprall = re.compile("|".join("("+x+")" for x in replacements))
    gi = 1
    replacements_by_gi = {}
    for (expr, replacement) in replacements.items():
        replacements_by_gi[gi] = replacement
        gi += re.compile(expr).groups + 1


    def choose(match):
        return replacements_by_gi[match.lastindex]

    return re.sub(exprall, choose, string)


text = "local foals drink cola"
print(dictsub({"(?<=o)a":"w", "l(?=a)":"co"}, text))

打印local fowls drink cocoa

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

string

substitution

pythonre

使用以正则表达式作为键的字典进行多个正则表达式替换的相关文章

Python 中的自然日/相对日

我想要一种在 Python 中显示日期项目的自然时间的方法类似于 Twitter 将显示刚才几分钟前两小时前三天前等消息 Django 1 0 在 django contrib 中有一个人性化方法我没有使用 Django
我应该将Python的pyc文件添加到.dockerignore吗？

我见过几个例子 dockerignorePython 项目的文件其中 pyc文件和或 pycache 文件夹被忽略 pycache pyc 由于无论如何这些文件文件夹都会在容器中重新创建我想知道这样做是否是一个好习惯是的这是一个
如何使用列表理解从列表中删除重复的项目？ [复制]

这个问题在这里已经有答案了如何使用列表理解从列表中删除重复的项目我有以下代码 a 1 2 3 3 5 9 6 2 8 5 2 3 5 7 3 5 8 b b item for item in a if item not in b 但它不
如何获取一个类的所有实例

我是一名初学者正在学习 Python 我想创建一个课程Person 在构造函数中我想将我创建的每个实例放入一个名为实例的集合中然后我希望实例方法返回所有实例我怎样才能做到这一点 class Person Type annota
python下安装xgboost 32位msys失败

尝试安装 xgboost 失败 Windows 和企业版版本为 Anaconda 2 1 0 64 位我该如何继续我一直在使用 R 似乎从 RStudio 在 R 中安装新包相当容易但在间谍程序中则不然因为我需要进入命令窗口来执行此
带剖面的 3D 曲面图

基本上我有一个由一组时间序列组成的曲面图我想在特定高度添加剖面图以更好地了解一年中值高于所选阈值的时期由此其中显示平面但不是剖面 To This 有什么建议吗使用 alpha 和相机仰角并没有解决问题平面似乎仍然在人物的前面
使用 Python 将 Json 转换为换行 Json 标准

我有一个获取嵌套对象并删除所有嵌套的代码使对象平坦 def flatten json y param y Unflated Json return Flated Json out def flatten x name if type x
使用字符串迭代 url - python

我现在完全被我的代码困住了首先我尝试从 volkskrant 的存档页面检索所有网址这是我被打击的第一步某一特定日期的 url 如下所示 http www volkskrant nl archief detail 01012016
Python 结构的 PHP 替代品

我很高兴在我的 Python 项目中使用 Fabric 进行部署现在我正在从事一个更大的 PHP 项目想知道是否有类似 PHP 的 Fabric 之类的东西唔为什么这有关系 Fabric 只是 python 脚本所以它与项目语言无
django 密码重置功能中出现 NoReverseMatch 错误

我正在尝试在 django 中实现密码重置功能下面是我的代码 urls py urlpatterns patterns url r signup accounts views signup name signup email url r
有人能给我一个 1 到 5 之间数字的正则表达式吗

有人能给我一个 1 到 5 之间的单个数字的正则表达式吗例如输入必须是 1 到 5 之间的数字 55 或 23 不匹配尝试使用anchors http www regular expressions info anchors html
从 SQL 数据库导入表并按日期过滤行时，将 Pandas 列解析为日期时间

我有一个DataFrame列名为date 我们如何将日期列转换解析为DateTime object 我使用 Postgresql 数据库加载日期列sql read frame 的一个例子date列是2013 04 04 我想做的是选择
python 3 configparser.read() 在给定不存在的文件时不会引发异常

当我尝试使用 configparser read 读取不存在的文件时我认为它应该引发异常事实并非如此它返回一个空列表显然我可以测试空列表并引发异常在我看来如果 configparser read 引发 FileNotFound
正则表达式（第一个字符匹配 a-z）

我有这个正则表达式 a zA Z0 9 上面我想补充的是第一个字符只能是a zA Z 我怎样才能制作这个正则表达式尝试这样的事情 a zA Z a zA Z0 9 解释 Start of line string a zA Z Chara
在 envoy 中使用 rm *（通配符）：没有这样的文件或目录

我正在使用 Python 和 Envoy 我需要删除目录中的所有文件除了一些文件外该目录是空的在终端中这将是 rm tmp my silly directory 常识表明在特使中这转化为 r envoy run rm tmp m
请解释*贪婪量词的工作原理

Pattern ptn Pattern compile a Matcher mtch ptn matcher bbaac if mtch find System out println mtch group 输出不打印任何内容 Patte
Python 3d 金字塔

我是 3D 绘图新手我只想用 5 个点建造一个金字塔并通过它切出一个平面我的问题是我不知道如何填充两侧 points np array 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 fig plt figure ax fi
python nltk从句子中提取关键字

我们要做的第一件事就是杀掉所有律师威廉莎士比亚鉴于上面的引用我想退出 kill and lawyers 作为两个突出的关键词来描述句子的整体含义我提取了以下名词动词 POS 标签 First NNP thing NN do V
Python DNS服务器IP地址查询

我正在尝试使用 python 获取 DNS 服务器 IP 地址要在 Windows 命令提示符下执行此操作我将使用 ipconfig 全部如下所示我想使用 python 脚本做同样的事情有什么方法可以提取这些值吗我成功提取了设备
如何将 pygame Surface 转换为 PIL 图像？

我正在使用 PIL 来透视地变换屏幕的一部分原始图像数据是一个 pygame Surface 需要转换为 PIL 图像因此我发现了 pygame 的 tostring 函数就是为了这个目的而存在的然而结果看起来很奇怪见附图这段代码

随机推荐

使用 gnuplot 绘制两个相邻的“带框”图

我试图将两个数据系列绘制在一张图中作为 gnuplot 中的方框该脚本目前如下所示 set terminal postscript eps enhanced color set title Distribution of the ext
C++：调用派生类的虚函数

假设我有一个带有虚函数的类和一个以不同方式实现该虚函数的派生类假设我还有一个用于存储派生类的基类向量如果事先不知道派生类是什么我将如何在向量中执行派生类的虚函数说明问题的最少代码 include
如何在任意 Java 应用程序中启用抗锯齿功能？

尽管 Swing 能够提供抗锯齿字体但许多 Java 应用程序默认情况下并不使用抗锯齿字体如何强制任意 Java 应用程序使用 AA 字体适用于我正在运行的应用程序和我正在开发的应用程序如果您有权访问源代码则可以在 main 方法
创建色轮的功能[关闭]

Closed 这个问题需要多问focused 目前不接受答案这是我多次伪解决但从未完全找到解决方案的问题问题是想出一种方法来生成N颜色尽可能区分N是一个参数我对此的第一个想法是如何在空间中生成 N 个向量使彼此之间的距离最大化
单元格悬停时的工具提示图像，Google 电子表格

我目前正在制作一个必须包含大量图像引用的 Google 电子表格我想要实现的是当您将鼠标悬停在单元格上时会出现图像如工具提示 I found 这个小部件在 Google Developers 上但是当我将代码添加到电子表格时什么也
IE9 下的 FakeSmile

我正在尝试在 IE9 中伪造 SMIL 支持假笑我动态创建 SVG 元素添加带有 animate 元素的 rect 元素并调用 beginElement IE9 给我一个错误对象不支持属性或方法 beginElement 静态 SVG
在数据库中存储标签的最有效方法是什么？

我正在我的网站上实现一个类似于 stackoverflow 使用的标签系统我的问题是存储标签以便搜索和过滤标签的最有效方法是什么我的想法是这样的 Table Items Columns Item ID Title Content Ta
无法在运行时修改mapred.job.name。它不在允许在运行时修改的参数列表中

我正在尝试在气流中运行一些蜂巢作业我建立了custome jdbc 连接您可以在图中看到我可以通过 Airflow Web ui 查询 Hive 表数据分析 gt 即席查询我还想运行一些来自互联网的示例 dag 文件 File N
“is”运算符未按预期工作

看看这段代码 import re ti abcd tq abcdef check abcd re compile abcd print id check abcd search ti print id check abcd search t
检查 Javascript 函数接受多少个参数？

With arguments length我可以看到有多少参数传递给函数但是有没有办法确定一个函数可以接受多少个参数以便我知道应该传入多少个参数 Function length会完成这项工作在我看来真的很奇怪 function tes
tkinter.TclError：图像“pyimage3”不存在

我在使用一个在屏幕上显示图像两秒钟然后被破坏的函数时遇到问题当程序运行时函数初始调用程序正常工作但如果随后通过 tkinter 中内置的按钮调用该函数则会出现错误 appcwd os getcwd user32 ctypes win
mvc 大写模型 vs 小写模型

我正在开发一个 MVC 5 项目对 MVC 来说非常陌生我注意到代码中的这一行 Html DropDownListFor model gt model ContractorId Model Contractors 页面顶部的指令是 mo
我可以更改之前所有提交中的姓名吗？

我想在我的所有提交中更改我的名字姓氏和电子邮件可以吗 Use git filter branch git filter branch commit filter if GIT AUTHOR NAME Josh Lee then expo
从高于最低要求的 API 级别调用 API

我编写的应用程序的大部分内容都很好最低 API 级别设置为 7 我想从级别 8 调用单个 API 使用较低版本 Android 的用户将在没有此额外功能的情况下生存目前我添加了 SuppressLint NewApi 这样我的代码就
如何从 C 方法调用 Objective-C 方法？

我有一个 Obj C 对象里面有很多方法有时一个方法需要调用同一对象内的另一个方法我似乎不知道如何让 C 方法调用 Obj C 方法 WORKS Obj C 方法调用 Obj C 方法 self objCMethod WORKS Ob
c++ 两种数组声明方法之间的区别

在 C 中声明数组并为它们分配内存的可能多种方法中的两种 1 int a 3 2 int b new int 3 我想了解 c 如何以不同的方式对待这两者 A 在这两种情况下我都可以使用以下语法访问数组 a 1 and b 1 b 当
如何在批处理文件中从txt文件创建数组？

我有一个包含以下数据的 txt 文件 aaaa 1000 2000 bbb 3000 4000 cccc 5000 ddd 6000 7000 8000 该文件中的行数不固定我需要数组中每行的第一个标记并打印每个元素创建数组 setlo
ActiveRecord 上的 to_json 时跳过具有 nil 值的属性

我想知道是否有任何方法可以跳过具有 nil 的属性 ActiveRecord 上 to json 时的值默认行为是包含 nil 值有没有一种方法可以让这个值不出现 lars 的答案适用于单个对象但对于 Active Record 对象
以编程方式将新列添加到 DataGridView

我有一个绑定到 DataTable 的 DataGridView DataTable 由数据库查询填充该表包含一个名为 BestBefore 的列 BestBefore 是格式化为字符串的日期 SQLite 没有日期类型我想以编程方式向
使用以正则表达式作为键的字典进行多个正则表达式替换

我想使用多个正则表达式对字符串进行多次替换我还想在一次传递中进行替换以避免创建字符串的多个实例假设对于参数我想进行下面的替换同时避免多次使用 re sub 无论是显式使用还是循环使用 import re text local fo

使用以正则表达式作为键的字典进行多个正则表达式替换

使用以正则表达式作为键的字典进行多个正则表达式替换 的相关文章

随机推荐

热门标签

使用以正则表达式作为键的字典进行多个正则表达式替换的相关文章