旁白:好吧,我知道我不应该用正则表达式来分解 HTML,但它是我需要的最简单的。
我有这个正则表达式:
Regex BodyEndTagRegex = new Regex("</body>(.*)$", RegexOptions.Compiled |
RegexOptions.IgnoreCase | RegexOptions.Multiline);
注意我如何寻找字符串的结尾$
.
.NET 的正则表达式是否经过优化,以便不必扫描整个字符串?如果不是,我该如何优化它以从最后开始?
您可以通过指定来控制它本身从右到左模式 http://msdn.microsoft.com/en-us/library/yd1hzczs.aspx#RightToLeft选项,但正则表达式引擎没有optimize它会自动自动执行,直到您自己通过指定选项来执行此操作:
我认为关键点是:
默认情况下,正则表达式引擎从左到右搜索。
您可以使用以下命令反转搜索方向
RegexOptions.RightToLeft 选项。搜索自动开始于
字符串的最后一个字符位置。用于模式匹配
包含起始位置参数的方法,例如
Regex.Match(String, Int32),起始位置是匹配的索引
搜索开始的最右边的字符位置。
重要的:
RegexOptions.RightToLeft 选项仅更改搜索方向;
它不会从右到右解释正则表达式模式
左边
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)