如何将c++与字边界匹配

2023-12-06

我想将单词“c++”与 Python 3 中的单词边界匹配。但我的猜测是 \b 也会在加号上触发。

为了清楚起见，我已简化为以下测试用例：

\bc\+\+\b

我希望我可以保留单词边界，但以某种方式更改其设置。

原因是我想将正则表达式放在 TfidfVectorizer 中的 token_pattern 中，我无法控制它们如何使用它。

链接到在线正则表达式工具

影响角色类“行为”的方法非常有限 - 它们称为标志：

re.ASCII ... 重新详细

他们f.e.允许r'.'匹配换行符 (re.DOTALL），改变行为^$ (re.MULTILINE）或使您的正则表达式匹配而不区分大小写（re.IGNORECASE).

他们都没有改变\b到没有'+'在里面。如果你想搭配c++对于 wordboundaries 你必须模仿\b-您的行为模式：

\b    Matches the empty string, but only at the beginning or end of a word. 
      A word is defined as a sequence of word characters. Note that formally, 
      \b is defined as the boundary between a \w and a \W character (or vice versa), 
      or between \w and the beginning/end of the string. This means that r'\bfoo\b' 
      matches 'foo', 'foo.', '(foo)', 'bar foo baz' but not 'foobar' or 'foo3'.

Source: https://docs.python.org/3/library/re.html#regular-expression-syntax

最简单的可能是将“c++”与前面的单词边界和后面的空格或非单词字符进行匹配。r'\bc\+\+[\s\W]'但这也匹配'c+++'。如果你想独家匹配'c++'但不是'c+++'你可能想放一个'\s'进入您的模式并使用您允许的其他字符扩展它：

r'\b(c\+\+)[\s.,!?]'

扩展括号中的字符以容纳 c++ 之后允许的更多内容 - 将它们从分组 (c++) 中排除将需要它们匹配但不将它们包含到组中。

至于正则表达式测试工具，也许改为https://regex101.com/- 它有Python支持，你甚至可以save模式和测试文本并提供链接：

https://regex101.com/r/6XtVTS/1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

python3x

如何将c++与字边界匹配的相关文章

互补DNA序列

我在编写这个循环时遇到问题它似乎在第二个序列之后停止了我想返回给定 DNA 序列的互补 DNA 序列例如 AGATTC gt TCTAAG 其中 A T 和 C G def get complementary sequence dna
正则表达式删除块注释也删除 * 选择器

我正在尝试使用 bash 从 css 文件中删除所有块注释我有以下 sed 命令的正则表达式 sed r s w s w d 这可以很好地去除块注释例如 This is a comment this is another comment
RewriteCond REQUEST_URI - ^ 未按预期工作

我正在 codeigniter 中构建一个网站我在 htaccess 文件中有一系列重写条件和规则第一组规则根据 uri 的第一段打开或关闭 SSL 然后它再次循环如果找到匹配项则适当地重定向页面如果没有匹配项并且 uri 不以
使用 Boto3 进行 IAM 身份验证的 SQLAlchemy 可刷新凭证

我使用 Boto3 生成的身份验证令牌通过 Sqlalchemy 连接到 Amazon RDS self client boto3 client rds region name eu central 1 self token self cl
无法使用 beautifulsoup 模块 python 从 HTML 检索温度值

我正在使用 BeautifulSoup4 来解析此 HTML 查看源代码 https weather com en IN weather today l 17 39 78 49 https weather com en IN weather
仅在大括号外的空格上分割字符串

我是正则表达式新手我需要一些帮助我阅读了一些与此问题类似的主题但我不知道如何解决它我需要在不在一对大括号内的每个空格上分割一个字符串大括号外的连续空格应被视为单个空格 TEST test test test test test t
正则表达式接受 4 条规则中的 3 条

我似乎无法让正则表达式正确满足以下要求长度在 8 到 20 之间的字符串必须包含至少 1 个大写字母字符至少 1 个小写字母字符以及至少 1 个数字或至少 1 个特殊字符字符或两者假设特殊字符仅限于包括我最初是这样写的 A Z
如何将 AWS Kinesis Video Stream GetMedia API 输出解码为 mp3/wav？

我现在使用 GetMedia API 通过 AWS Connect 服务将数据提取到 Kinesis Video Stream KVS 我能够提取Payload但如何将此输出转换为 mp3 wav 我想将此输出提取到 AWS Transcr
如何使用正则表达式匹配模式的最后一次出现

我有一个像这样的字符串 token1 token2 我要匹配 token2 使用正则表达式它应该匹配的其他可能的情况是 token1 应该匹配最后一个 token1 应该匹配最后一个 token1 token2应该匹配 token2
.htaccess 异常导致主目录出现问题

这是我的目录结构 localhost or livehost app bootstrap public vendor code demo 这是我的 htaccess
如何只获取父类对象的属性

我有两节课 class Parent object def init self id name self id id self name name self parent vars id name make a copy def print
正则表达式匹配整个单词[重复]

这个问题在这里已经有答案了我在 stackoverflow 上看到了很多关于使用正则表达式进行全词匹配的例子我有以下情况我想用 www xyz com 替换 www abc com string RetVal I am going t
初始化 dask 分布式工作线程的状态

我正在尝试做类似的事情 resource MyResource def fn x something dosemthing x resource return something client Client results client m
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
JavaScript RegEx：不同的结果：使用字符串和使用正则表达式“文字”构建模式？

使用 RegExp 文字与字符串之间有什么区别吗 http jsfiddle net yMMrk http jsfiddle net yMMrk String prototype lastIndexOf function pattern p
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
TypeError：在 Python 3.8.1 上运行 Pytest 脚本时，参数中缺少必需字段“posonlyargs”

我在 Python 3 8 1 上创建了一个简单的 Selenium Pytest 自动化脚本运行脚本后我看到以下错误 Traceback most recent call last Error messages TypeError r
如何添加 id 列来标识 read_html() 表？

考虑以下站点 site1 http pastebin com vpnGqn5X site2 http pastebin com FbAFGbfR site3 http pastebin com LqZWxFSP 其中有许多不同的表我在用读
ipython/ pylab/ matplotlib安装和初始化错误

我在 OS X El Captain 上安装了 matplotlib anaconda ipython 然而即使在尝试以所有可能的方式设置环境变量之后我仍无法启动 ipython shell pylab 版本这是错误 ImportEr
Javascript Replace() 和 $1 问题

我正在尝试创建一个脚本来搜索文本中的模式并在它找到的字符串周围包裹一个标签 shop attributes td each function this html function i html return html replace E 0

随机推荐

当“Model”实例是在启用急切模式的情况下构造的时，不支持在图形模式下调用“Model.predict”

所以我只是跟随某人的项目并在收到此错误时到达这里 2020 10 12 15 33 21 128 ERROR in app Exception on predict POST Traceback most recent call last
无法更改网状中的Python路径

启动 rstudio 会话时运行的第一行是 library reticulate use python usr local lib python3 6 site packages 然而当我跑步时py config 它显示仍在使用默认的 p
使用 Objective C 将文本字符串插入 NSTextView 中的光标位置或选择的文本

我如何使用 Objective C 和 cocoa 使用 Xcode 来做到这一点我试图在单击按钮时在光标处或用户选择处插入一个字符串 NSTextView 有一个方法 insertText 可以执行您想要的操作 myTextView i
使用 PyQt 动态将项目设置为 QML ListModel

我有一个代表时间表的 QML 它从数据库获取值所以我需要插入值ListModel来自我的Python代码 QML 看起来像这样 function append newElement scheduleList model append ne
如何在正则表达式中定义空格（在 awk 中）？

我想打印里面的文字例如我有以下字符串 gfdg jkfgh jkfd fdgj fd ghjhgj gfggf kfdjfdgfhbg fhfghg jhgj jhfjhg dfgdf fgf fgfdg dfj jfdg jhfgjd
如何使用Kivy制作ToolTip？

我想看到工具提示Qt当鼠标指针悬停在图标上时操作栏是的我可以使用mode spinner 但图标更好您可以改进和扩展的一个简单示例 from kivy app import App from kivy lang import Buil
将进程 ID 添加到 log4cxx 中的日志文件名中

在 log4net 中我可以轻松地将进程 ID 设置为从配置中轻松记录文件名
无循环求和

I have following double summation 10 i 1 i j 1 i 5 10 j i 我对这个练习很迷茫我尝试了下面的代码但尽管给了我一个数字但它返回了一个错误很确定它不正确任何帮助都非常有价值 i
如何获取 Facebook 视频的观看次数

我首先使用 facebook graph api 获取全局视频视图然后我想尝试单独的视频视图但是当我尝试以下语法时获取 v2 5 object id insights page video views 我得到这个答案 data pag
用于命名空间扩展的图标覆盖处理程序

我正在开发命名空间扩展它提供服务器上文件的虚拟视图在此视图中我需要使用覆盖图标提供文件的不同状态正在使用离线不同步等我阅读了实现覆盖处理程序的文章并认为我将尝试在我们的覆盖处理程序之一中处理此问题该处理程序实现 IShel
如何使用Cookie检查用户是否已经登录？

我想知道如何检测用户是否已经登录使用cookie 我没有使用任何登录控件我有一个数据库可以检查 ID 和 PWD 另请告诉我是否可以在不使用 cookie 的情况下完成任何代码或链接都会有帮助网络配置
Android 下拉颜色选择器

我想创建一个下拉颜色选择器如下所示抱歉图像丑陋我只需要一些颜色比方说 6 种所以我不需要完整的颜色选择器下拉菜单就可以正常工作我知道我必须扩展 Spinner 的阵列适配器并覆盖获取下拉视图 and getView 我不知道的
如何从一个文件中读取随机行？

有内置方法可以做到这一点吗如果不是我怎样才能在不花费太多开销的情况下做到这一点不是内置的而是算法R 3 4 2 Waterman 的 Reservoir Algorithm 来自 Knuth 的计算机编程的艺术很好非常简化的版
如何从父子表中获取结果

Work on SQL服务器我的表结构如下 CREATE TABLE dbo AgentInfo AgentID int NOT NULL ParentID int NULL CONSTRAINT PK AgentInfo PRIMARY
运行命令、流式传输 stdout/stderr 并捕获结果

我正在尝试使用std process Command运行命令并流式传输其 stdout 和 stderr 同时捕获 stdout stderr 的副本我发现我可以使用spawn 此代码将捕获输出但不会在发生时将其流式传输到 stdout
如何修复“没有名为‘app_one’的模块”

我有一个具有以下结构的 Python 包 gt python package package root directory gt app one subpackage directory gt init py gt views py gt
Adobe Air：在不同应用程序之间更改焦点时滚动条会抛出错误

TypeError Error 1009 Cannot access a property or method of a null object reference at spark components Scroller focusInH
如何平滑 CamShift 中的跟踪

我正在使用 OpenCV 库函数进行手头跟踪项目通过使用Camshift 我可以跟踪我的手但它不稳定即使我使我的手稳定跟踪也几乎没有移动所以我无法在正确的位置执行鼠标单击操作有人请帮我解决这个问题 void TrackingOb
复制时的 PouchDB/CouchDB 序列计数器

I am live将新创建的 pouchdb 3 3 1 同步到已建立的 iris couchdb 初始复制成功发生 pause事件被触发 If I do info 在本地我得到的 update seq 为362 如果我做info 在遥控
如何将c++与字边界匹配

我想将单词 c 与 Python 3 中的单词边界匹配但我的猜测是 b 也会在加号上触发为了清楚起见我已简化为以下测试用例 bc b 我希望我可以保留单词边界但以某种方式更改其设置原因是我想将正则表达式放在 TfidfVector

如何将c++与字边界匹配

如何将c++与字边界匹配 的相关文章

随机推荐

热门标签

如何将c++与字边界匹配的相关文章