如何从python 3中的url读取html

2024-01-02

我查看了以前的类似问题，却变得更加困惑。

在 python 3.4 中，我想根据给定的 url 将 html 页面作为字符串读取。

在 Perl 中，我使用 LWP::Simple 使用 get() 来完成此操作。

matplotlib 1.3.1 示例显示：import urllib; u1=urllib.urlretrieve(url)。 python3找不到urlretrieve.

I tried u1 = urllib.request.urlopen(url)，这似乎得到了HTTPResponse对象，但我无法打印它或获取它的长度或索引它。

u1.body不存在。我找不到该的描述HTTPResponse在Python3中。

中是否有一个属性HTTPResponse哪个对象会给我 html 页面的原始字节？

（与其他问题无关的内容包括urllib2，它在我的 python、csv 解析器等中不存在）

Edit:

我在之前的问题中发现了一些部分（大部分）完成这项工作的内容：

u2 = urllib.request.urlopen('http://finance.yahoo.com/q?s=aapl&ql=1')

for lines in u2.readlines():
    print (lines)

我说“部分”是因为我不想阅读单独的行，而只想阅读一大串。

我可以连接这些行，但打印的每一行前面都有一个字符“b”。

这是从哪里来的？

再说一遍，我想我可以在连接之前删除第一个字符，但这确实会成为一个问题。

请注意，Python3 不会将 html 代码作为字符串读取，而是作为bytearray，所以你需要将其转换为decode.

import urllib.request

fp = urllib.request.urlopen("http://www.python.org")
mybytes = fp.read()

mystr = mybytes.decode("utf8")
fp.close()

print(mystr)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

html

URL

如何从python 3中的url读取html 的相关文章

如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何使用 JavaScript 创建链接？

我有一个标题字符串和一个链接字符串我不知道如何将两者放在一起以使用 JavaScript 在页面上创建链接任何帮助表示赞赏我试图解决这个问题的原因是因为我有一个 RSS 源并且有一个标题和 URL 列表我想将标题链接到 URL 以使
socket.io 的良好初学者教程？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
@media语法/可能的组合

我见过其中一些 media print media screen handheld print projection media all media all and property value media screen and prope
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
HTML5 MediaSource 适用于某些 mp4 文件，但不适用于其他文件（相同的编解码器）

我正在玩 MediaSource API 代码直接取自 Mozilla 的示例页面 https developer mozilla org en US docs Web API MediaSource endOfStream https d
尝试将数据存储在点击器网站中

我正在尝试存储一个名为的变量score无论何时刷新您都会一次又一次地使用它我不明白的是它的代码是什么我尝试了一些方法但似乎都不起作用这是我的答题器网站但是当我尝试使用 JavaScript 来存储它时它不起作用window o
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
如何创建适合屏幕宽度的等宽/高框？ [复制]

这个问题在这里已经有答案了我正在尝试建立一个网站其中有很多宽度和高度相等的框例如我有一个页面其中并排有两个相同大小的框简单的解决方案是将宽度和高度设置为 50vw 这在出现滚动条之前效果很好我已经用谷歌搜索了几个小时但无法理
在 HTML 下拉列表中有一个滚动条

我正在寻找一种在 HTML 的下拉列表中添加滚动条的方法这样如果下拉列表包含的内容超过例如 5 项将出现滚动条以查看其余项这是因为我将被迫列出一些大清单过去几个小时我一直在谷歌上搜索它但没有运气它需要适用于 IE8 FF 和 C
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
CSS溢出文本显示在几行中，没有断字

我有一些长文本显示在 div 中该 div 具有固定的宽度和高度我希望文本显示在几行上作为 div 高度并且句子单词不会中断一行中的单词前缀和下一行中的继续此外我想在末尾添加省略号最后一句话 CSS white space n

随机推荐

如何在ajax响应返回的脚本标签内执行javascript

我正在发送一个 jquery get 请求如下所示 get this attr href this serialize null script 我期望收到的响应将包含在脚本标签中我知道浏览器不会执行响应除非它返回时没有脚本标记通常我
元素中“Project”属性的值“”无效。 vs2012

我在尝试在 Visual Studio 2012 中加载某些项目时收到以下错误 G path project csproj error The value of the Project attribute in element
如何在 VS Code 上设置 AngularDart5

我已经广泛搜索了有关如何在 Visual Studio Code 上有效设置 Angular Dart 5 的文档但到目前为止没有发现任何结论我已经搜索过的地方 Youtube 堆栈溢出 https webdev dartlang or
Maven 与查询 DSL 集成

我正在尝试将 Maven 中的现有项目与查询 dsl 集成我添加了如下依赖项
.Net Core 中的 PagedList.Core.Mvc PagedListPager Html 扩展不存在

似乎是PagedList Core不包含 Html helper 的扩展方法所以我无法使用下面的代码 Html PagedListPager Model page gt Url Action Index new page PagedLis
加载实体时的 nhibernate 竞争条件

我的网络应用程序中存在休眠竞争条件问题我知道在使用旧版本的 log4net 时会发生这种情况应该在 1 2 10 中修复尽管我也经历过这种情况因此我们暂时禁用了 log4net 因为竞争条件会导致 IIS 崩溃并且在生产中发生这
Bazel 的 Mingw-w64 工具链 (Ubuntu 20.04.1 )

我正在尝试使用 Bazel 在 Ubuntu 上为 mingw w64 创建工具链我正在关注这个教程 https docs bazel build versions master tutorial cc toolchain config
按 Enter 键后调用 onChange 事件

我是 Bootstrap 的新手并遇到了这个问题我有一个输入字段只要我输入一位数字函数就会onChange被调用但我希望当我输入整个号码后按 Enter 时调用它验证函数也有同样的问题它调用得太快 var inputProce
在表格视图中组合静态和原型内容

有没有办法使用故事板将静态表格视图单元格静态内容与动态表格视图单元格原型内容结合起来我建议您将表格视为动态表格但在顶部包含您始终想要的单元格在故事板中放置一个UITableViewController并让它使用动态表添加任
使用 Robolectric 和 Mockito 测试 CursorLoader

鉴于我正在开发一个简单的 ListFragment 在本例中它从 MediaStore 读取艺术家列表但稍后也会从不同的源读取数据如下所示 EFragment public class ArtistsFragment extends
如何将 SQL 查询返回值绑定到 psql 变量？

背景我正在写我的第一篇文章pgTAP http pgtap orgPL pgSQL 函数的测试用例并从小处开始使用 psql 测试脚本没有问题但我遇到了一个小烦恼psql变量 http www postgresql org docs
ARM 的加载和存储字节和半字指令如何工作？签名与未签名有何作用？

我刚刚开始学习 ARM 但无法理解加载和存储指令的确切作用加载说明 ldrsb ldrb ldrsh ldrh ldr 店铺说明 strb strh str 有符号或无符号加载半字是什么意思或者加载字节有符号或无符号有符号和无
2018 年底起的目标 API 级别要求

我不知道这是否是询问以下问题的正确地方我在 google play 开发者控制台上读到 2018 年下半年 Play 将要求新应用程序和应用程序更新针对最新的 Android API 级别这将需要 2018 年 8 月推出新应用程序
使用 JPA 进行更新时如何排除实体字段

有没有办法使字段在更新操作时不持久但在使用 JPA Hibernate 4 创建操作时持久我用这种方式尝试过 Transient Id Column name USER NAME nullable false length 75 pri
在用户控件中处理画笔的更好方法是什么

在 Paint 事件中使用新画笔是否是更好的方法即 protected override void OnPaint PaintEventArgs e e Graphics SmoothingMode SmoothingMode AntiA
替换整行会导致替换文本重复出现

简单的问题为什么 x replace y 产生 yy x replace y 相当于 Regex replace x y 结果yy您看到的内容基于其工作原理根据 MSDN 在指定的输入字符串中替换所有字符串匹配一个具有指定替换字符串
与平台无关的文件锁定？

我正在进行一项计算量非常大的科学工作时不时地会得出结果这项工作基本上就是多次模拟同一件事因此它被分配到使用不同操作系统的多台计算机上我想将所有这些实例的输出定向到同一个文件因为所有计算机都可以通过 NFS Samba 查看相同的文
在 R 中使用 fromJSON 时处理 NaN

我正在尝试使用 R 中的 fromJSON 函数来读取给我的 JSON 文件但是该文件有NaN在其中我无法正确读取它这是我得到的错误 Error in feed push parser buf lexical error invali
支持 19 位 Visa 和 Discover 卡验证的正则表达式模式 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案目前我正在使用以下正则表达式但它们不支持 Visa 和 Discover 的 19 位卡请帮忙 visaCardPattern 4 0
如何从python 3中的url读取html

我查看了以前的类似问题却变得更加困惑在 python 3 4 中我想根据给定的 url 将 html 页面作为字符串读取在 Perl 中我使用 LWP Simple 使用 get 来完成此操作 matplotlib 1 3 1 示

如何从python 3中的url读取html

如何从python 3中的url读取html 的相关文章

随机推荐

热门标签