如何在 C# 中使用正则表达式解析 HTML?
例如,给定 HTML 代码
<s2> t1 </s2> <img src='1.gif' /> <span> span1 <span/>
我正在尝试获得
1. <s2>
2. t1
3. </s2>
4. <img src='1.gif' />
5. <span>
6. span1
7. <span/>
如何在 C# 中使用正则表达式来执行此操作?
就我而言,HTML 输入不是像 XHTML 那样格式良好的 XML。因此我不能使用 XML 解析器来执行此操作。
正则表达式是解析 HTML 的一种非常糟糕的方法。如果您可以保证您的输入是格式良好的 XML(即 XHTML),您可以使用 XmlReader 读取元素,然后按照您喜欢的方式打印它们。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)