正则表达式匹配由任何字符分组包围的可选组

2024-01-03

我正在尝试匹配一个可选组,该组前面和后面可以有任意数量的字符。整个模式也有必需的开始和结束匹配,但中间的匹配是可选的。

我从这个开始,当需要中间组时它有效:

string text = @"blah blah foo This is a test blah.  the test does not work. bar";
string  requiredBlah = @"(foo).*?(blah).*?(bar)";
Match m = Regex.Match(text, requiredBlah);

结果是“foo”、“blah”、“bar”。

但是,当中间组是可选的时,我猜正则表达式引擎的机制更喜欢不匹配中间组。

string optionalBlah = @"(foo).*?(blah)?.*?(bar)";

结果:“foo”、“”、bar”。

This 所以答案 https://stackoverflow.com/questions/31772440/regex-force-parsing-optional-groups说如果可选组之前和之后有分隔符,我可以捕获中间可选组,但这不是我的情况。

我可以完全跳过可选组并使用string.Contains("blah"),但我想知道是否有一个纯粹的正则表达式解决此类问题。我的目标是设计与通用模式匹配的正则表达式,具有多个可选部分,以便我可以确定模式的哪些部分丢失。


这个问题很常见。第二个点匹配模式抓住了blah并且不必将其交还给(blah)?因为它是可选的(参见我将捕获组添加到原始正则表达式中以显示哪些组匹配blah).

最简单的解决方案是封闭惰性.*?模式和(blah)将捕获组转换为可选的非捕获组(即(?:.*?(blah))?)使正则表达式引擎尝试匹配组模式至少一次(=greedily):

(foo)(?:.*?(blah))?.*?(bar)

See the . Here, (foo)捕获foo在第 1 组中,(?:.*?(blah))?匹配除换行符之外的 0 个或更多字符的可选序列,尽可能少,然后捕获blah进入第2组,然后.*?(bar)匹配0个或多个除换行符之外的字符,尽可能少,然后捕获bar进入第 3 组:

另一种解决方案是通过前瞻来限制点匹配(使用所谓的脾气暴躁的贪婪令牌 http://www.rexegg.com/regex-quantifiers.html#tempered_greed):

(foo)(?:(?!blah).)*(blah)?.*?(bar)
     ^^^^^^^^^^^^^^

See the . The (?:(?!blah).)*模式匹配第一个之前的任何文本blah。 (如果它位于模式的末尾,它也可能匹配到字符串的末尾。)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

正则表达式匹配由任何字符分组包围的可选组 的相关文章

  • 如何在 Unity 中从 RenderTexture 访问原始数据

    问题的简短版本 我正在尝试访问 Unity 中 RenderTexture 的内容 我一直在使用 Graphics Blit 使用自己的材质进行绘制 Graphics Blit null renderTexture material 我的材
  • 模板类的不明确多重继承

    我有一个真实的情况 可以总结为以下示例 template lt typename ListenerType gt struct Notifier void add listener ListenerType struct TimeListe
  • FFMPEG Seeking 带来音频伪影

    我正在使用 ffmpeg 实现音频解码器 在读取音频甚至搜索已经可以工作时 我无法找到一种在搜索后清除缓冲区的方法 因此当应用程序在搜索后立即开始读取音频时 我没有任何工件 avcodec flush buffers似乎对内部缓冲区没有任何
  • Cygwin 下使用 CMake 编译库

    我一直在尝试使用 CMake 来编译 TinyXML 作为一种迷你项目 尝试学习 CMake 作为补充 我试图将其编译成动态库并自行安装 以便它可以工作 到目前为止 我已经设法编译和安装它 但它编译成 dll 和 dll a 让它工作的唯一
  • C# 中值类型和引用类型有什么区别? [复制]

    这个问题在这里已经有答案了 我知道一些差异 值类型存储在堆栈上 而引用类型存储在托管堆上 值类型变量直接包含它们的值 而引用变量仅包含对托管堆上创建的对象位置的引用 我错过了任何其他区别吗 如果是的话 它们是什么 请阅读 堆栈是一个实现细节
  • 跨多个控件共享事件处理程序

    在我用 C 编写的 Windows 窗体应用程序中 我有一堆按钮 当用户的鼠标悬停在按钮上时 我希望按钮的边框发生变化 目前我有以下多个实例 每个按钮一个副本 private void btnStopServer MouseEnter ob
  • 如何在 WPF RichTextBox 中跟踪 TextPointer?

    我正在尝试了解 WPF RichTextBox 中的 TextPointer 类 我希望能够跟踪它们 以便我可以将信息与文本中的区域相关联 我目前正在使用一个非常简单的示例来尝试弄清楚发生了什么 在 PreviewKeyDown 事件中 我
  • 如何针对 Nancy 中的 Active Directory 进行身份验证?

    这是一篇过时的文章 但是http msdn microsoft com en us library ff650308 aspx paght000026 step3 http msdn microsoft com en us library
  • C# 用数组封送结构体

    假设我有一个类似于 public struct MyStruct public float a 我想用一些自定义数组大小实例化一个这样的结构 在本例中假设为 2 然后我将其封送到字节数组中 MyStruct s new MyStruct s
  • HttpClient 像浏览器一样请求

    当我通过 HttpClient 类调用网站 www livescore com 时 我总是收到错误 500 可能服务器阻止了来自 HttpClient 的请求 1 还有其他方法可以从网页获取html吗 2 如何设置标题来获取html内容 当
  • 为什么模板不能位于外部“C”块内?

    这是一个后续问题一个答案 https stackoverflow com questions 4866433 is it possible to typedef a pointer to extern c function type wit
  • 使用向量的 merge_sort 在少于 9 个输入的情况下效果很好

    不知何故 我使用向量实现了合并排序 问题是 它可以在少于 9 个输入的情况下正常工作 但在有 9 个或更多输入的情况下 它会执行一些我不明白的操作 如下所示 Input 5 4 3 2 1 6 5 4 3 2 1 9 8 7 6 5 4 3
  • 编译的表达式树会泄漏吗?

    根据我的理解 JIT 代码在程序运行时永远不会从内存中释放 这是否意味着重复调用 Compile 表达式树上会泄漏内存吗 这意味着仅在静态构造函数中编译表达式树或以其他方式缓存它们 这可能不那么简单 正确的 他们可能是GCed Lambda
  • C 中的位移位

    如果与有符号整数对应的位模式右移 则 1 vacant bit will be filled by the sign bit 2 vacant bit will be filled by 0 3 The outcome is impleme
  • 检查 url 是否指向文件或页面

    我们需要以下内容 如果文件确实是文件 则从 URL 下载该文件 否则 如果它是一个页面 则什么也不做 举个简单的例子 我有以下命令来下载文件 My Computer Network DownloadFile http www wired c
  • EPPlus Excel 更改单元格颜色

    我正在尝试将给定单元格的颜色设置为另一个单元格的颜色 该单元格已在模板中着色 但worksheet Cells row col Style Fill BackgroundColor似乎没有get财产 是否可以做到这一点 或者我是否必须在互联
  • 已过时 - OpenCV 的错误模式

    我正在使用 OpenCV 1 进行一些图像处理 并且对 cvSetErrMode 函数 它是 CxCore 的一部分 感到困惑 OpenCV 具有三种错误模式 叶 调用错误处理程序后 程序终止 Parent 程序没有终止 但错误处理程序被调
  • 将变量分配给另一个变量,并将一个变量的更改反映到另一个变量中

    是否可以将一个变量分配给另一个变量 并且当您更改第二个变量时 更改会瀑布式下降到第一个变量 像这样 int a 0 int b a b 1 现在 b 和 a 都 1 我问这个问题的原因是因为我有 4 个要跟踪的对象 并且我使用名为 curr
  • 如何将字符串“07:35”(HH:MM) 转换为 TimeSpan

    我想知道是否有办法将 24 小时时间格式的字符串转换为 TimeSpan 现在我有一种 旧时尚风格 string stringTime 07 35 string values stringTime Split TimeSpan ts new
  • 不同类型的指针可以互相分配吗?

    考虑到 T1 p1 T2 p2 我们可以将 p1 分配给 p2 或反之亦然吗 如果是这样 是否可以不使用强制转换来完成 或者我们必须使用强制转换 首先 让我们考虑不进行强制转换的分配 C 2018 6 5 16 1 1 列出了简单赋值的约束

随机推荐

  • 如何使用 mongodb 聚合返回字符串数组

    我需要返回带有 mongodb 聚合的字符串数组 我做了以下事情 db users aggregate group id emails address 它返回 id a a com id email protected cdn cgi l
  • 如何在 PHP 中生成多个数组中项目的所有组合

    我正在尝试查找多个数组中项目的所有组合 数组的数量是随机的 可以是 2 3 4 5 每个数组中的元素数量也是随机的 例如 我有 3 个数组 arrayA array A1 A2 A3 arrayB array B1 B2 B3 arrayC
  • R如何根据长格式data.frame列计算相对值?

    我有一个像这样的数据框 我想添加一列gene richness relative 在本专栏中 gene richness价值为days 0应设置为100 作为计算基础 其他日期的相对值应该反映变化 我从几天后排序的 data frame 开
  • R:如何对数据框中定义的不同时间段内的数据进行平均?

    假设我有一个数据框 data 其中包含测量变量 x 的时间序列数据 date x 2009 10 01 00 00 10 2009 10 01 01 00 11 2009 10 01 02 00 12 2009 10 01 03 00 13
  • Qt:没有为 Windows 发行版本生成地图/pdb 文件

    我的 Qt 4 7 4 项目文件在 Windows 发行版本下不会生成 map pdb 文件 因此 事后调试是不可能的 有任何标志可以改变这一点吗 将以下内容添加到 pro 文件中 QMAKE LFLAGS RELEASE MAP QMAK
  • 如何在 Lighttpd 中设置 cookieless 域?

    我想设置禁用 cookie 的域 以提供静态内容 那么就不要在您的域上设置 cookie 严重地 这就是你所要做的 只需使用子域 并确保您不会在该域的任何位置点击任何脚本解决方案 php python 等 另外 请确保您没有启用任何会导致
  • 在 Flutter 中实现推荐奖励

    我想在我的应用程序中建立一个推荐系统 以便用户可以通过电子邮件 电话号码等 以最简单的方式 邀请他们的朋友 当确认被邀请者安装了该应用程序时 它将奖励原始邀请比如说 发件人一个月没有横幅广告 我在网上能找到的唯一参考资料是这个 https
  • HttpMediaTypeNotAcceptableException:在异常处理程序中找不到可接受的表示

    我的控制器中有以下图像下载方法 Spring 4 1 RequestMapping value get image id fileName method RequestMethod GET public ResponseBody byte
  • Spring Boot 管理页面

    我试图了解如何在我的应用程序中使用 SBAP 因为它是一个非常方便的开发工具 我正在读他们的参考指南 http codecentric github io spring boot admin 1 3 2 getting started但我不
  • 如何使用 jQuery 或 CSS 自动调整(拉伸)div 高度和宽度

    我有 4 个 div id 为 A B C 和 D 如下所示 div div div div div div div div div div Div A 和 D 具有固定的宽度和高度 Div B 具有固定宽度 我想要自动计算 Div B 的
  • Pandas 过滤器计数

    我有一些数据按一秒间隔内的出现情况进行分组 我在寻找正确的方法来过滤掉低于特定阈值的计数时遇到问题 例如我不想显示计数低于 100 的任何内容 我尝试了各种版本的过滤器 lambda 构造 但我无法在调用 count 方法之前或之后进行过滤
  • 具有布尔值和多个参数的 python 多处理

    我有一个接受多个参数的函数 其中一些是布尔值 我正在尝试将其传递给多处理pool apply async并想要传递一些带有附加名称的参数 这是我正在使用的示例脚本 from multiprocessing import Pool def t
  • 如何将环境变量传递给docker-compose up

    我正在尝试运行一个容器 我已经将镜像上传到私有 Docker 注册表 我想编写一个撰写文件来下载和部署映像 但我想将标签名称作为变量从 docker compose run 命令传递 我的撰写文件如下所示 如何将 KB DB TAG VER
  • 是否可以升级 Angularjs 属性指令以在 Angular 4 中使用?

    我已经能够升级 AngularJS 元素指令以在 Angular 4 中使用 这是示例代码 myScores js angular module app components directives myScores directive my
  • PHP 上的无限循环的 Pthreads 与 Parallel

    我正在寻找一种在 PHP 上执行多线程的方法 并遇到了 pthreads PHP API 我认为它很容易实现 但是我必须找出如何安装支持 Debian 的 ZTS 的 PHP 版本 问题是 当我查看 pthreads php net 文档时
  • 查找8086微处理器中的物理地址

    在8086微处理器中 20位地址分为16位 4位地址 其中4位二进制是段地址 当我们将4位二进制转换为十六进制时 它会变成1位十六进制 我的问题是当我们遇到计算物理地址的问题时从逻辑地址上看 给出的是一个4bit的十六进制段地址 为什么会这
  • 如何验证 Perl 中的函数参数?

    你能告诉我 Perl 中验证函数参数最明智的方法是什么吗 代码片段 sub testfunction my args my value args gt value die no value set process value testfun
  • Redux 和 React Router:结合调度和导航 (history.push)

    我对如何使用 React Router 有点一无所知history push route with Redux 换句话说 如果你将一个组件与 Redux 的连接mapDispatchToProps 你怎么放history push rout
  • 为什么 Flowable 不是 Observable

    为什么 Flowable 不是 Observable Observable 接口几乎是 Flowable 的子集 它们的实现几乎相同 为什么他们不实现一个通用接口 以便我们可以直接将 Flowable 转换为 Observable 为什么
  • 正则表达式匹配由任何字符分组包围的可选组

    我正在尝试匹配一个可选组 该组前面和后面可以有任意数量的字符 整个模式也有必需的开始和结束匹配 但中间的匹配是可选的 我从这个开始 当需要中间组时它有效 string text blah blah foo This is a test bl