为什么python的re.search方法挂起？

2023-11-22

我正在使用 python 正则表达式库来解析一些字符串，目前我发现我的正则表达式要么太复杂，要么我正在搜索的字符串太长。

这是挂断的示例：

>>> import re
>>> reg = "(\w+'?\s*)+[-|~]\s*((\d+\.?\d+\$?)|(\$?\d+\.?\d+))"
>>> re.search(reg, "**LOOKING FOR PAYPAL OFFERS ON THESE PAINTED UNCOMMONS**") #Hangs here...

我不确定发生了什么事。任何帮助表示赞赏！

编辑：这是一个链接，其中包含我试图匹配的示例：Regxr

代码执行挂起的原因是灾难性的回溯由于量化组内有一个强制性模式和 1 个以上可选模式（可以匹配空字符串的模式）(\w+'?\s*)+这允许正则表达式引擎测试大量匹配路径，数量太多以至于需要很长时间才能完成。

我建议以这样的方式解开有问题的群体：' or \s成为强制性的并将它们包装在可选组中：

(\w+(?:['\s]+\w+)*)\s*[-~]\s*(\$?\d+(?:\.\d+)?\$?)
^^^^^^^^^^^^^^^^^^^***

See the 正则表达式演示

Here, (\w+(?:['\s]+\w+)*)将匹配 1+ 个单词字符，然后匹配 0+ 个 1+ 的序列'或空格后跟 1 个以上单词字符。这样，模式就变成线性的，并且如果出现不匹配的字符串，正则表达式引擎会更快地失败。

其余的模式：

\s*[-~]\s*- 任何一个- or ~用 0+ 空格包裹
(\$?\d+(?:\.\d+)?\$?) - Group 2 capturing
- \$?- 1 或 0$ symbols
- \d+- 1+ 位数字
- (?:\.\d+)? - 1 or 0 zero sequences of:
  - \. - a dot
  - \d+- 1+ 位数字
- \$?- 1 或 0$ symbols

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

为什么python的re.search方法挂起？的相关文章

使用 openCV 对图像中的子图像进行通用检测

免责声明我是计算机视觉菜鸟我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子我的用例有点不同因为我不希望它是具体的而且我不确定如何做到这一点如果可能的话但我感觉应该如此我有大量图像数据集有时其中一些图像是数据集的
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
使用 sed 删除大括号对之间的所有内容

我有一个看起来像这样的字符串 B F blue master F red f k b f k b K black B F green 我想删除匹配的子字符串它可能包含也可能不包含相同顺序的其他子字符串我应该得到 master 作为最终输
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
JavaScript RegEx：不同的结果：使用字符串和使用正则表达式“文字”构建模式？

使用 RegExp 文字与字符串之间有什么区别吗 http jsfiddle net yMMrk http jsfiddle net yMMrk String prototype lastIndexOf function pattern p
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

didFailLoadWithError UIWebview 的乐趣

如果你看一下这里的代码 https github com evernote evernote sdk ios blob master evernote sdk ios internal ENOAuthViewController m 在 U
字符串未被识别为有效的 DateTime ParseExact

我正在尝试解析 C 中的日期并具有以下代码行 DateTime ParseExact DateSelected ddd MMM dd HH mm ss zzz yyyy Culture 当我调试 DateSelected 时显示为 Tue
Spark RDD 中更新值的有效方法是什么？

我正在编写一个与图形相关的程序Scala with Spark 该数据集有 400 万个节点和 400 万条边您可以将其视为一棵树但是对于每次 Iteration 我只编辑其中的一部分即以给定节点为根的子树以及给定节点和根之间的路径
Android Studio - Gradle 同步失败：已处置

更新到后Android Studio 3 2 测试版 1 我开始收到两个不同项目的以下错误 Gradle sync failed Already disposed Android Studio 3 1 3没有错误更新到beta 1之前的A
Scala/Lift 检查日期格式是否正确

我的电梯应用程序中有一个日期输入框我想检查用户输入的日期格式是否正确日月年我怎样才能在scala中为此编写正则表达式检查我看过模式匹配示例但这似乎过于复杂 PS 我不必使用正则表达式欢迎使用任何其他替代品 SimpleDat
Cocoa/OSX - NSWindow standardWindowButton 在复制并再次添加后行为异常

在我的应用程序中我更改了 standardWindowButtons 关闭缩小展开的位置如下所示 Create the buttons NSButton minitButton NSWindow standardWindowButt
yield() 和 sleep() 有什么区别？

我知道一个区别如果我们说thread sleep 1000 该线程将休眠1000毫秒是肯定的而yield 没有这样的保证这对于线程调度很有用因为调用的线程yield 很可能立即再次选择运行还有什么线程 sleep The 当前线
将表示二进制的字符串转换为二进制python

我无法找到解决方案基本上我到目前为止所做的就是创建一个字符串它表示 x 个字符的二进制版本这些字符被填充以显示所有 8 位例如如果 x 2 那么我有 0101100110010001 总共 8 位数字现在我有两个长度相同的字符串
在 Windows 8 应用程序中保存 List
的最佳方式是什么
我有一个List

如何检查.NET中的字符串是否是数字？ [复制]

这个问题在这里已经有答案了如何检查 NET中给定的字符串是否是数字 test1 是字符串 1232 是数字测试是字符串 tes3t 是字符串 2323k 是字符串 4567 是数字我如何使用系统功能来做到这一点您可以编写一个简单的

不下载文件的远程文件大小

有没有办法获取远程文件的大小http my url my file txt无需下载文件发现了一些关于这个的事情here 这是我发现的获取遥控器大小的最佳方法文件请注意 HEAD 请求不会获取请求的实际正文他们只是检索标题因此向

Android：如何检查服务器是否可用？

我正在开发一个连接到服务器的应用程序至此如果服务器可用则登录和数据传输工作正常当服务器不可用时就会出现问题在这种情况下该方法发送登录请求并等待响应有谁知道如何检查服务器是否可用可见必须实现的简单逻辑的伪代码如下 Strin

与此 Bash 命令等效的 PowerShell 是什么？

我正在尝试创建一个CLI命令有TFS检查其中包含特定字符串的所有文件我主要使用Cygwin 但是tf命令在 Cygwin 环境中运行时无法解析路径我认为 PowerShell 应该能够做同样的事情但我不确定等效的命令是什么grep a

上传到 YouTube API 时缺少“Access-Control-Allow-Origin”

多年来我们已经使用一些自定义 JavaScript 代码成功通过 YouTube API 上传视频该代码基于 Google 提供的一些示例 cors upload js 这不是我们经常使用的东西只是每隔几周使用一次几周前一切都运转良

MongoDB $query 运算符忽略索引？

我创建了一个测试 MongoDB 集合样本集合其文档如下所示 id ObjectId 510929e041cb2179b41ace1c stringField Random string0 longField NumberLong 88

iOS 中的 NSURLErrorCancelled = -999 是什么？

有人可以描述如何使用 NSURLErrorCancelled 999 吗来自苹果文档 NSURLErrorCancelled 999 当异步加载被取消时返回 Web Kit 框架委托执行取消时将收到此错误对加载资源的操作请注意 NS

.NET Core 3 中不触发 ShouldSerialize 方法

我通常使用ShouldSerialize排除没有数据例如数组的属性但现在当我仅在中使用 JSON 序列化器时它似乎不会被触发 NET Core 3 使用时被触发NewtonSoft但我已将其从我的项目中删除因为它似乎不再需要例

根据两个图像之间的差异创建蒙版 (iPhone)

如何检测两个图像之间的差异创建不同区域的掩模以便处理两个图像共有的区域例如高斯模糊 EDIT 我目前正在使用此代码来获取像素的 RGBA 值 NSArray getRGBAsFromImage UIImage image atX in

为什么每个人都说 SpinLock 更快？ [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我在互联网上阅读了很多文档文章和帖子几乎每个地方的每个人都认为 SpinLock 对

为什么python的re.search方法挂起？

我正在使用 python 正则表达式库来解析一些字符串目前我发现我的正则表达式要么太复杂要么我正在搜索的字符串太长这是挂断的示例 gt gt gt import re gt gt gt reg w s s d d d d gt gt
热门标签

VectorDraw

心灵鸡汤

● 成长之路

对偶

CCG

两阶段鲁棒

LED灯实验

vivado教程

自定义布局

menu资源文件

基础普及

CodeArts

高级提升

yaml 数组

处理器规格

联发科

datasheet

规格书

约定优于配置

Python日常练手

NI

自适应算法

Java核心知识

linux初学者
Powered by Hwhale

为什么python的re.search方法挂起？

为什么python的re.search方法挂起？ 的相关文章

随机推荐

热门标签

为什么python的re.search方法挂起？的相关文章