我正在使用 Nokogiri 来抓取网页。很少有 url 需要猜测,当它们不存在时,会返回 404 未找到错误。有没有办法捕获这个异常?
http://yoursite/page/38475 #=> page number 38475 doesn't exist
我尝试了以下方法,但没有成功。
url = "http://yoursite/page/38475"
doc = Nokogiri::HTML(open(url)) do
begin
rescue Exception => e
puts "Try again later"
end
end
它不起作用,因为你没有拯救部分代码(它是open(url)
调用),如果发现 404 状态,则会引发错误。以下代码应该可以工作:
url = 'http://yoursite/page/38475'
begin
file = open(url)
doc = Nokogiri::HTML(file) do
# handle doc
end
rescue OpenURI::HTTPError => e
if e.message == '404 Not Found'
# handle 404 error
else
raise e
end
end
顺便说一句,关于救援Exception
:
为什么在 Ruby 中 `rescue Exception => e` 是一种不好的风格? https://stackoverflow.com/questions/10048173/why-is-it-bad-style-to-rescue-exception-e-in-ruby
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)