如何在 C# 中使用正则表达式解析 HTML?

2024-01-05

如何在 C# 中使用正则表达式解析 HTML?

例如,给定 HTML 代码

<s2> t1 </s2>  <img src='1.gif' />  <span> span1 <span/>

我正在尝试获得

1.  <s2>
2.  t1
3. </s2>
4. <img src='1.gif' />
5. <span>
6. span1
7. <span/>

如何在 C# 中使用正则表达式来执行此操作?

就我而言,HTML 输入不是像 XHTML 那样格式良好的 XML。因此我不能使用 XML 解析器来执行此操作。


正则表达式是解析 HTML 的一种非常糟糕的方法。如果您可以保证您的输入是格式良好的 XML(即 XHTML),您可以使用 XmlReader 读取元素,然后按照您喜欢的方式打印它们。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 C# 中使用正则表达式解析 HTML? 的相关文章

随机推荐