好的,这就是我需要的:
- 我们有维基百科文章的完整 XML
- 我们只需要信息框部分
我尝试过各种方法,但我的主要问题似乎是无法匹配“内部”花括号。有什么想法(或者您已经设法完成此任务的任何正则表达式吗?)
对于那些不知道我在说什么的人,这是我试图解析的一个(有些删节的)示例:http://regexr.com?38299
(需要的是之间的部分{{Infobox *******
直到其相应的右括号(}}
).
好,我知道了!
尝试这个..:
(?=\{Infobox)(\{([^{}]|(?1))*\})
这是工作示例:
http://regex101.com/r/kT1jF4
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)