Python 正则表达式中的反斜杠转义序列和单词边界

2023-11-29

目前使用re.sub(re.escape("andrew)"), "SUB", stringVar)

预期行为：

stringVar = " andrew) "
re.sub(re.escape("andrew)"), "SUB", stringVar) # Returns " SUB "

意外行为：

stringVar = "zzzandrew)zzz"
re.sub(re.escape("andrew)"), "SUB", stringVar) # Returns "zzzSUBzzz"

所以我尝试使用单词边界来修复“zzzandrew)zzz”，但是我的修复破坏了我的基本情况。

stringVar = " andrew) "
re.sub(r'\b%s\b' % re.escape("andrew)"), "SUB", stringVar) # Breaks and returns the original stringVar

From: https://docs.python.org/2.0/ref/strings.html-> 原始字符串并对反斜杠转义序列使用不同的规则。那么除了re.escape我还应该做什么呢？

来自蟒蛇re module docs

\b

匹配空字符串，但仅匹配单词的开头或结尾。单词被定义为字母数字或下划线字符的序列，因此单词的结尾由空格或非字母数字表示，非下划线字符。请注意，正式地，\b 被定义为 \w 和 \W 字符之间的边界（反之亦然），或 \w 之间的边界以及字符串的开头/结尾，因此精确的字符集是否被视为字母数字取决于 UNICODE 的值和 LOCALE 标志。例如，r'\bfoo\b' 匹配 'foo'、'foo.'、'(foo)'、 '酒吧 foo baz' 但不是 'foobar' 或 'foo3'。

在您的情况下，单词边界被识别为 andrew 和 ) 之间，它是第一个非字母数字非下划线字符。下面的示例说明了如果在转义中包含或排除“)”会发生什么情况。

>>> stringVar = " andrew) "
>>> re.sub(r'\b%s\b' % re.escape("andrew)"), "SUB", stringVar)
' andrew) '
>>> re.sub(r'\b%s\b' % re.escape("andrew"), "SUB", stringVar)
' SUB) '
>>> stringVar = "zzzandrew)zzz"
>>> re.sub(r'\b%s\b' % re.escape("andrew"), "SUB", stringVar)
'zzzandrew)zzz'

如果您必须使用 ')' 作为转义的一部分，您可以使用积极的前瞻断言如下所示，如果 'andrew)' 之后有空格 (\s) 或非字母数字字符 (\W)，则匹配

>>> stringVar = " andrew) "
>>> re.sub(r'\b%s(?=\s)' % re.escape("andrew)"), "SUB", stringVar)
' SUB '
>>> stringVar = "zzzandrew)zzz"
>>> re.sub(r'\b%s(?=\s)' % re.escape("andrew)"), "SUB", stringVar)
'zzzandrew)zzz'
>>> stringVar = " andrew) "
>>> re.sub(r'\b%s(?=\W)' % re.escape("andrew)"), "SUB", stringVar)
' SUB '
>>> stringVar = "zzzandrew)zzz"
>>> re.sub(r'\b%s(?=\W)' % re.escape("andrew)"), "SUB", stringVar)
'zzzandrew)zzz'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

Python 正则表达式中的反斜杠转义序列和单词边界的相关文章

如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
JavaScript RegEx：不同的结果：使用字符串和使用正则表达式“文字”构建模式？

使用 RegExp 文字与字符串之间有什么区别吗 http jsfiddle net yMMrk http jsfiddle net yMMrk String prototype lastIndexOf function pattern p
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

在 FTP 上传期间，发送文件的总大小？

当您通过 HTTP 发送文件时 Web 浏览器会在 http 标头中发送文件总大小你觉得这和FTP协议是一样的吗 Martin FTP 有多种传输模式但没有一种模式会预先发送文件的整个长度你可以在其中看到它们全部RFC 959 第 3
fopen 失败，getaddrinfo 失败

我在使用以下代码时遇到问题 function http file exists url f fopen url r if f fclose f return true else return false url http www minhe
在单个活动架构中实现多片段配置（例如主从）时，我应该如何构建布局文件？

我目前正在切换到single activity architecture它将管理加载片段进出container layout 事情进展顺利但我遇到了障碍我想实施master detail模式但我无法找出处理布局文件的最佳方法我想到了
AWS.net 库与 MonoTouch 兼容吗？

我正在使用 MonoTouch 开发一个新应用程序我想将数据存储在 AWS 中我看到 Amazon 提供了一个 AWS net 库但我不知道是否可以将它与我的 MonoTouch 应用程序一起使用我可以吗根据常见问题解答标准 N
如何在长时间运行的查询中延长限制时间跨度？

是否可以在查询中间延长 Throttle Timespan 值例如假设一个例子101 Rx 样本节流有这个查询var throttled observable Throttle TimeSpan FromMilliseconds 750
覆盖 ui:insert 和 ui:include-Handler

有many other topics关于如何覆盖 JSF 中的现有渲染器所有这些都导致 faces config 中的相同条目你只需要一个component family renderer type render kit id和你的
使用 NVM 设置节点版本或安装（如果不可用）。

我正在尝试向我的 bash 配置文件添加一些内容将我的节点版本设置为特定版本如果未安装节点版本则安装它到目前为止我所拥有的是 usr local opt nvm nvm sh if nvm use v6 9 1 then nvm i
Java 字段类型用于一般递归自类型的值？

给定一个类层次结构其中基类定义了递归自类型 abstract class A
.NET EF 6 复数形式，表名称中带有前缀

复数表名是 EF 中的默认约定但不幸的是当我添加前缀后我无法再使用复数名称有任何想法吗 protected override void OnModelCreating DbModelBuilder modelBuilder mode
如何解决生产系统上的内存不足错误

我们在 Windows 上使用 JBoss 4 0 4 GA 和 JDK 1 5 0 无更新 JBoss 服务器在 Wrapper 中运行版本 3 2 3 http wrapper tanukisoftware org 由于 JVM 太旧
Yesod 的莎士比亚模板（哈姆雷特）和 IO

哈姆雷特中如何使用内部IO操作的结果例如 someIO IO String with stuff lt someIO p stuff 失败与 No instance for blaze markup 0 6 0 0 Text Blaze
如何在 R/exams 练习中包含 TikZ 图像？

R exams 包支持使用其功能包含 TikZ 图形include tikz 例如如图所示自动机 and logic练习随包装一起提供得到后include tikz 进行这些练习参见为什么 TikZ 图形是用 exams2pdf 渲
如何让垂直渐变背景在所有浏览器中工作？

如果您要获得从白色到某种灰色的垂直渐变背景您会怎么做你可以用CSS来做看看这个链接它使用了优秀浏览器中的 CSS3 属性以及 IE 的特性filter使用 IE 时的属性 CSS gradient background FFFFFF
运行存储过程的随机超时 - 删除重新创建修复

因此我在一个已有 10 年历史的系统上使用一个较大的数据库 30 gig sql 2005 和 net 3 5 Web 前端它有新的和旧的位我们遇到一个越来越频繁发生的问题一个存储过程到目前为止我们已经有 4 个不同的存储过程决
在 ClearCase 中隐藏元素

我试图隐藏 ClearCase 视图中的一个元素我在配置规范中设置了以下行 element path to some element none 在我的配置规范的更下方包含另一个配置规范反过来又包含其他配置规范等等完全混乱但我无法更
对动作侦听器进行编程的常用方法是什么？

我刚刚开始学习如何使用动作监听器据我了解它的工作原理如下有一些类默认包含 addActionListener 方法例如按钮类使用此方法我们向对象添加一个动作侦听器例如 listenedObject addActionListe
连接中出现未知的 SSL 协议错误

我想将我的提交推送到 Bitbucket 存储库但发生了此错误 Fatal unable to access https email protected myUsername myRepository git Unknown SSL pr
!in_array 在 PHP 中的使用 - 条件语句

我想看看如何使用 in array 我有这段代码但它不起作用 while row mysql fetch assoc result if in array row item output output row print json enc
WPF：选择组合框的可编辑文本框中的所有文本并将焦点设置为

我有一个WPFComboBox其中有它的IsEditable属性绑定到视图模型可以打开和关闭它当它打开时我想将焦点放在ComboBox并选择编辑中的所有文本TextBox 我看不出实现这一目标的最佳方法我应该更换ControlTem
Python 正则表达式中的反斜杠转义序列和单词边界

目前使用re sub re escape andrew SUB stringVar 预期行为 stringVar andrew re sub re escape andrew SUB stringVar Returns SUB 意外行为 s

Python 正则表达式中的反斜杠转义序列和单词边界

Python 正则表达式中的反斜杠转义序列和单词边界 的相关文章

随机推荐

热门标签

Python 正则表达式中的反斜杠转义序列和单词边界的相关文章