我正在尝试自动检测损坏的链接,我惊讶地发现 HTTP头法 http://en.wikipedia.org/wiki/HEAD_%28HTTP%29#Request_methods并不总是可靠的。例如网址:http://www.youtube.com/mit http://www.youtube.com/mit-- URL 可以使用 GET 方法访问,但尝试使用 HEAD 方法联系 URL 最终会收到 404 错误(未找到)。
Note:该示例可以通过以下方式轻松在线检查:http://web-sniffer.net/ http://web-sniffer.net/(我与该网页没有任何关系)
那么HEAD方法到底有多可靠呢?
作为一个合理的解决方案,我认为不使用 HEAD 并始终使用 GET 方法,但这会浪费带宽。
HEAD
需要按照中描述的方式工作the RFC https://www.rfc-editor.org/rfc/rfc2616#section-9.4;然而,它的实现总是受到任何特定站点的开发人员的摆布,并且不可能强制执行 RFC 合规性。您可以相当有信心任何网站都可能支持HEAD
相当好,但正如您已经发现的那样,没有任何保证。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)