我正在做一个小爱好项目。我已经编写了获取 url、下载标头并返回 mime 类型/内容类型的代码。
然而,在此之前的步骤是我坚持的步骤 - 我需要基于标签内部和引号中检索页面上所有网址的内容,即
...
<link rel='shortcut icon' href="/static/favicon.ico" type="image/x-icon" />
...
会找到网站图标链接。
.net 库中有什么有用的东西吗?或者这是否必须是正则表达式的情况?
我会考虑使用Html 敏捷包.
以下是直接来自示例页面的示例,说明如何查找页面中的所有链接:
HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(/* url */);
foreach(HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)