$tags = array(
"applet" => 1,
"script" => 1
);
$html = file_get_contents("test.html");
$dom = new DOMdocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$body = $xpath->query("//body")->item(0);
我要循环遍历网页的“正文”并删除 $tags 数组中列出的所有不需要的标签,但我找不到方法。那么我该怎么做呢?
你有没有考虑过HTML 净化器?从你自己的 html 清理开始只是重新发明轮子,而且不容易完成。
此外,黑名单方法也很糟糕,请参阅SO/为什么使用白名单进行 html 清理
您可能还有兴趣阅读如何配置允许的标签和属性 or 测试 HTML Purifier 演示
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)