我查看了以前的类似问题,却变得更加困惑。
在 python 3.4 中,我想根据给定的 url 将 html 页面作为字符串读取。
在 Perl 中,我使用 LWP::Simple 使用 get() 来完成此操作。
matplotlib 1.3.1 示例显示:import urllib; u1=urllib.urlretrieve(url)
。
python3找不到urlretrieve
.
I tried u1 = urllib.request.urlopen(url)
,这似乎得到了HTTPResponse
对象,但我无法打印它或获取它的长度或索引它。
u1.body
不存在。我找不到该的描述HTTPResponse
在Python3中。
中是否有一个属性HTTPResponse
哪个对象会给我 html 页面的原始字节?
(与其他问题无关的内容包括urllib2
,它在我的 python、csv 解析器等中不存在)
Edit:
我在之前的问题中发现了一些部分(大部分)完成这项工作的内容:
u2 = urllib.request.urlopen('http://finance.yahoo.com/q?s=aapl&ql=1')
for lines in u2.readlines():
print (lines)
我说“部分”是因为我不想阅读单独的行,而只想阅读一大串。
我可以连接这些行,但打印的每一行前面都有一个字符“b”。
这是从哪里来的?
再说一遍,我想我可以在连接之前删除第一个字符,但这确实会成为一个问题。