正则表达式提取嵌套模式[重复]

2024-02-18

可能的重复：
在 Python 中将嵌套结构与正则表达式匹配 https://stackoverflow.com/questions/1099178/matching-nested-structures-with-regular-expressions-in-python

我无法解决这个问题。我有一个像下面这样的字符串：

Lorem ipsum dolor sit amet [@a xxx yyy [@b xxx yyy [@c xxx yyy]]] lorem ipsum sit amet

我的任务是提取命令（它们总是以[@并以]) 及其子命令。结果就像

[
    [@a xxx yyy [@b xxx yyy [@c xxx yyy]]], # the most outer
    [@b xxx yyy [@c xxx yyy]],              # the middle one
    [@c xxx yyy]                            # the inner most
]

将不胜感激。问题是这些类型的命令可能出现在很长的文本消息中，因此“高性能”的解决方案会很好。

我大部分时间都在玩弄一些正则表达式模式，比如

(\[@.*?\]\s) # for the outer one

但我没有看到匹配中间和内部的光。更复杂的是，嵌套命令的数量是可变的...... 一些特殊的正则表达式可能是解决方案吗？我读过有关前瞻和后视的内容，但不知道如何在这种特殊情况下使用它们。

谢谢一堆！

UPDATE

@Cyborgx37 向我指出了另一篇使用 pyparsing 包的帖子。如果有一个没有外部包或库的解决方案就好了。但 pyparsing 肯定解决了这个问题！

C# 有递归/嵌套正则表达式，我不相信 Python 有。您可以对以前的结果重新运行 RegEx 搜索，但这可能比仅仅创建自定义解析器效率低（RegEx 对于如此简单的搜索的开销）。您搜索“[@”和“]”的文本并不是很复杂。

这是一个可以完成这项工作的自定义解析器（JavaScript）。

var txt = "Lorem ipsum dolor sit amet [@a xxx yyy [@b xxx yyy [@c xxx yyy]]] lorem ipsum sit amet";
function parse(s) {
    var stack = [];
    var result = [];
    for(var x=0; x<s.length; x++) {
        var c = s.charAt(x);
        if(c == '[' && x+1 < s.length-1 && s.charAt(x+1) == '@') {
            for(var y=0; y<stack.length; y++)
                stack[y] += "[@";
            stack.push("[@");
            x++;
        } else if(c == ']' && stack.length > 0) {
            for(var y=0; y<stack.length; y++)
                stack[y] += "]";
            result.push(stack.pop());
        } else {
            for(var y=0; y<stack.length; y++)
                stack[y] += c;
        }
    }
    return result;
}
parse(txt);

它快速循环遍历文本的所有字符（仅一次），并使用堆栈和 if...if else...else 条件分别压入、弹出和修改堆栈中的值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

python3x

正则表达式提取嵌套模式[重复] 的相关文章

我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
检测并缩短字符串中的所有网址

假设我有一条字符串消息您应该将 file zip 上传到http google com extremelylonglink zip http google com extremelylonglink zip not https stack
Python 3d 绘图设置固定色阶

我正在尝试绘制两个 3d 数组第一个数组的 z 值在范围内 0 15 0 15 第二个来自 0 001 0 001 当我绘图时色标自动遵循数据范围如何设置自定义比例我不想看到 0 001 的浅色而应该看到 0 15 的浅色如何修
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中，而无需显式调用每个属性

我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体而无需在编译时知道属性名称 https stackoverflow com question
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
每当使用 import cv2 时 OpenCV 都会出错

我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时在 python IDLE 上它都会说 Trac
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有

随机推荐

如何录制屏幕并保存为gif动画？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案有这样的软件吗尝试这个名为 Cropper 的免费工具无限帧将输出设置为动画 Gif http cropper codeplex com htt
iOS 动画在 iOS7 中的我的应用程序中停止工作

我发现我的应用程序中的所有 ios 动画都停止工作这种情况在 iOS7 中非常频繁地发生我有一个支持 iOS 5 6 和 7 的应用程序最近我发现所有 iOS 动画在 iOS7 中的应用程序中都停止工作在 IOS 7 中当在后台线
EditTextPreference 禁用按钮？

我想要一个 EditTextPreference 如果 EditText 字段中没有文本它将禁用确定按钮我创建了一个自定义 EditTextPreference 类并且能够获取 EditText 对象并设置 TextWatcher
Nginx 不接受字节范围

我正在使用 nginx 来提供文件系统中的视频我想启用范围请求目前这是我的文件返回的结果 curl I fileurl HTTP 1 1 200 OK Server nginx Date Sat 29 Mar 2014 06 41 41
使用Ansible、Jenkins和docker构建快速测试环境

我计划使用ansible jenkins和docker一起构建测试环境计划是这样的为您在环境中使用的每个工具创建 ansible 剧本并将其存储在 git 上使用 jenkins create job 在开发服务器上创建 docker
如何使用 EF 在 MVC Code-first 中更新/创建多对多关系数据？

我仔细研究了 StackOverflow Google 和 asp net 试图找到一个清晰基本的示例来说明如何做到这一点所有的例子都是抽象的或涉及不适用的复杂情况我没能从他们身上获得太多有用的东西到目前为止他们都没有完全回答我的
Spring RestTemplate 将响应流式传输到另一个请求中

我正在尝试使用 spring 将文件下载的结果直接流式传输到另一篇文章中RestTemplate 我目前的方法如下 ResponseEntity
为express.js更新Cookie会话

我正在使用cookie会话 https github com expressjs cookie sessionExpress js 处理会话的模块我希望在每次页面加载或ajax调用时更新会话这就是他们通常在任何地方工作的方式文档对
Python + Selenium：从“ng-bind”获取跨度值

所以我有 Selenium 代码可以使用 chrome 访问页面现在在该页面上有这样的 HTML span Heloooo span 如何使用 python 和 Selenium 获取值所以只有Heloooo 谢谢您可以使用以下 CS
$.proxy() 和 bind() 有什么区别？

2009 年 ECMAScript 5 添加了一个内置的bind 函数接受一个对象作为参数并返回一个相同的函数其中this将始终引用您传递给它的对象我找不到任何看起来像规范文档链接的内容这与jQuery 的 proxy 功能 http
处理 Yesod 表单中的数据集合

是否有可能在Yesod https en wikipedia org wiki Yesod web framework 处理包含数据集合的表单我有一个用户可以添加多个人的表单在前端它目前看起来像这样 people map person
使用 AFNetworking 下载大文件

我正在尝试实现大文件的下载并向用户显示当前进度但阻止 AFURLConnectionOperation setDownloadProgressBlock 返回不正确bytesRead and totalBytesRead值它们小于应有的
Hyperledger Fabric 的性能测试

在尝试使用 Hyperledger Fabric 实现 IBM 团队在其文章中报告的性能期间Hyperledger Fabric 用于许可区块链的分布式操作系统 https arxiv org abs 1801 10228 我遇到了一些问题
寻找跨平台开发的最佳 PCL 配置文件

我正在努力扩展我的应用程序支持的平台数量它曾经支持 NET4 Windows Store Windows Phone 但我希望也涵盖适用于 Android 和 iOS 的 Mono 我已将所有业务逻辑模型和视图模型放入可移植类库 PCL
Blazor GetAsync 请求返回 401 状态代码

我是 blazor 新手尝试使用 NET Core EF Core 3 和 Visual studio 2019 创建一个应用程序我已经设置了一个数据库模型和一个 API 用于获取所有地址 api Address 并在浏览器中浏览到此地
C# WinForm BackgroundWorker 不更新进度栏

我在让后台工作人员更新进度条时遇到了一些麻烦我使用在线教程作为示例但我的代码无法正常工作我在这个网站上进行了一些挖掘但找不到任何解决方案我对后台工作者进度的事情很陌生所以我不完全理解它只是为了设置我有一个主窗体窗体 1
传递到字典中的模型项的类型为“MyType”，但该字典需要类型为“MyType”的模型项

是的我浏览了类似标题的问题它们似乎都不符合我所处的情况这只是程序员向视图发送了错误的对象类型这是我收到的确切错误消息传递到字典中的模型项的类型为 IS Extensions Models ContactSelectList 但此字
Haskell 中的并发数据库连接池

我是一名学习 Haskell 的 Java 程序员我正在开发一个小型 Web 应用程序该应用程序使用 Happstack 并通过 HDBC 与数据库进行通信我写过select and exec函数我这样使用它们 module Mai
使用 onOptionsItemSelected 从 PreferenceActivity 和 PreferenceFragments 向上移动

我使用时遇到问题onOptionsItemSelected使用 Android Studio 的默认设置活动 extends AppCompatPreferenceActivity 活动的重要部分是 public class Settin
正则表达式提取嵌套模式[重复]

这个问题在这里已经有答案了可能的重复在 Python 中将嵌套结构与正则表达式匹配 https stackoverflow com questions 1099178 matching nested structures with re

正则表达式提取嵌套模式[重复]

正则表达式提取嵌套模式[重复] 的相关文章

随机推荐

热门标签