我一直在尝试使用 pycurl 检索 HTML 页面,因此我可以使用 str.split 和一些 for 循环解析它以获取相关信息。我知道 Pycurl 检索 HTML,因为它将它打印到终端,但是,如果我尝试做类似的事情
html = str(c.perform())
该变量仅保存一个表示“None”的字符串。
如何使用 pycurl 获取 html,或重定向它发送到控制台的任何内容,以便它可以用作如上所述的字符串?
非常感谢任何有建议的人!
这将发送请求并存储/打印响应正文:
from StringIO import StringIO
import pycurl
url = 'http://www.google.com/'
storage = StringIO()
c = pycurl.Curl()
c.setopt(c.URL, url)
c.setopt(c.WRITEFUNCTION, storage.write)
c.perform()
c.close()
content = storage.getvalue()
print content
如果要存储响应标头,请使用:
c.setopt(c.HEADERFUNCTION, storage.write)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)