我一直在尝试抓取这个网站:http://www.e3050.com/Cases-Fans-PDU/C http://www.e3050.com/Cases-Fans-PDU/C
我可以正常抓取任何内容,但会转到下一页,调试后我发现他们为每个页面请求发送 __Viewstate 参数。
viewstate 参数存储在每个页面响应中,因此我发现我需要每页获取它并将其发送到下一页。
我使用此 xpath 获取 __viewstate :
sel.xpath('//input[@id="__VIEWSTATE"]/@value').extract()
我还收到一个错误,因为它们发送的视图状态与页面响应中列出的视图状态不同,这两个参数都是 64 基编码,但它们每个请求发送的数据比我从页面响应中获取的数据多。
我该如何处理这个问题?他们如何获取 viewstate 参数?
编辑:
__EVENTVALIDATION 参数也存在同样的问题。
出于安全原因,__VIEWSTATE 是 .net 中使用的一个参数。
它基本上是您请求的页面的推荐页面的哈希值。
它通常嵌入在标签中,您只需在每个请求之前提取它并将其添加到下一个请求中。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)