假设我有这样的事情:
var = '<li> <a href="/...html">Energy</a>
<ul>
<li> <a href="/...html">Coal</a> </li>
<li> <a href="/...html">Oil </a> </li>
<li> <a href="/...html">Carbon</a> </li>
<li> <a href="/...html">Oxygen</a> </li'
提取标签之间文本的最佳(最有效)方法是什么?我应该为此使用正则表达式吗?我当前的技术依赖于分割字符串li
标签并使用for
循环,只是想知道是否有更快的方法来做到这一点。
从标记语言中提取信息的推荐方法是使用解析器,例如美丽的汤是一个不错的选择。避免使用正则表达式为此,它不是适合这项工作的工具!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)