Python 网页抓取：BeautifulSoup 未显示所有 html 源内容

2024-02-23

我对网络抓取和Python还很陌生。我正在尝试制作一个脚本来获取最后的交易价格但当我用 python 请求时，一些内容似乎丢失了。我之前制作过从其他网站成功获取数据的脚本，但我似乎无法让我的代码在该网站上运行。
到目前为止，这是我的代码：

from bs4 import BeautifulSoup
import requests

r = requests.get("http://finra-markets.morningstar.com/BondCenter/BondDetail.jsp?symbol=NFLX4333665&ticker=C647273")
c = r.content
soup = BeautifulSoup(c, "html.parser")

all = soup.find_all("div", {"class": "gr_row_a5"})
print(soup)

当我运行这个时，大多数重要数据都丢失了。

任何帮助将非常感激。

有些网页使用Javascript填充数据，看起来是页面内容的内容实际上并不是Beautiful Soup正在处理的HTML。这是其中一页。

这很令人困惑，因为如果您使用 Safari 或 Chrome 中的 Web 开发人员工具检查显示的页面，您会发现已渲染到 DOM 中的 HTML。然而，如果你查看页面源代码，你根本找不到它。

所以对于这个页面，你无法用Beautiful Soup解析出数据。一种替代方案是建立一个以更直接的方式为您提供数据的网站。另一种可能是尝试requests-html https://html.python-requests.org库，它可以运行 Javascript，然后您可以从渲染的 HTML 中抓取数据。（注：我从未尝试过requests-html我自己，并且在以这种方式运行 Javascript 时应该小心，但这是一种看似合理的方式。）还有一些项目，人们使用 Selenium 或类似的东西作为获取 HTML 的方法。但requests-html看起来是最简单的尝试。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 网页抓取：BeautifulSoup 未显示所有 html 源内容的相关文章

当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
表单发布请求并存储收到的数据

我有一个非常简单的表单在提交时发出发布请求
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
使用 Jade 评估自定义 javascript 方法 (CircularJSON)

我想通过 Jade 将一个对象解析为客户端 JavaScript 通常这会起作用 script var object JSON parse JSON stringify object but my object is circular ht
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
有没有办法使用 ko.observableArray 作为地图？

有没有办法使用ko observableArray http knockoutjs com documentation observableArrays html像地图字典一样例如 var arr ko observableArray
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
react-native - 图像需要来自 JSON 的本地路径

你好社区我正在react native中开发一个测试应用程序并尝试从本地存储位置获取图像我实际在做什么我将图像直接链接源提供给 var 并在渲染函数中调用此方法 react 0 14 8 react native 0 23 1 np
在 iOS 7 Safari 中，如何区分通过边缘滑动与后退/前进按钮的 popstate 事件？

在 iOS 7 Safari 中现在有两种后退前进导航方式使用底部的传统后退前进按钮箭头或从屏幕边缘滑动我正在使用动画在 ajax 应用程序中的页面之间进行转换但如果用户通过边缘滑动进行导航我不想触发该转换因为这本身就是一个
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
Selenium Standalone Server 和 Java selenium Jar 文件有什么区别

这可能听起来像个愚蠢的问题但我想知道 Selenium 独立服务器和 Java selenium Jar 文件之间的区别我可以使用这两个 jar 文件导入 Webdriver 类如果 selenium 独立服务器提供了所有必需的 ja
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
将数组从 jquery ajax 传递到代码后面

我必须将二维数组传递给在asp net网页代码后面编写的页面方法我有一个变量objList作为二维数组我使用以下代码来实现此目的但没有成功并且未调用页面方法脚本语言 function BindTable objList ajax u
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

Mongo PHP 驱动程序 1.2.10 与 MAMP

我正在尝试让最新的 Mongo 驱动程序与 OS X 10 5 8 上的 MAMP 1 9 6 一起使用我从源代码成功构建了它因为似乎没有预编译版本将其包含到正确的目录中并重新启动了 apache 但 PHP 无法识别该扩展名我之前
CSS：发光文本，发光非常宽和高

几天以来我一直在研究 box shadow 和 text shadow 我正在努力获得以下效果我想要从文字中散发出光芒 a 一度盘旋很简单这应该很容易因为我探索了使用文本阴影好的但它适用于小发光我的意思是一旦发光较大由于其
Eclipse 在接口方法签名中生成无用的“公共抽象”修饰符

在使用 Eclipse 重构工具提取方法时有没有办法阻止生成无用的内容public abstract接口方法签名中的修饰符谢谢阿列克谢这听起来像是一个 Eclipse 错误但它有一个解决方法该错误自 2004 年 8 月 9 日起
CFHTTPMessageAddAuthentication 无法向请求添加身份验证数据

我正在尝试扩展功能SocketRocket https github com square SocketRocket图书馆我想添加身份验证功能由于该库正在使用CFNetwork CFHTTPMessage API https devel
如何在离线服务器上安装 npm -g

我需要在离线服务器上安装全局 npm 应用程序安装普通应用程序很容易 npm install 然后打包生成的文件手动或使用npm pack 但是如何安装全局应用程序具有某种安装脚本例如forever没有互联网 npm insta
在同一个 R markdown 页面中应用多列划分

我想如图所示分割我的 Rmarkdown 文档第一部分为一列其他部分为两列 used onecolumn and twocolumn但每个部分都是在单个页面中创建的有解决办法吗 This article https journals
如何在jquery中获取tinymce内容？

我正在尝试获取tinymce数据但收到tinyMCE未定义错误这是我的代码 function savePost console log jQuery wp tinymce editor tinyMCE getContent 请检查 Ti
使用 knockout js 和 jquery ui 滑块

我试图弄清楚knockout js是否可以很好地解决以下问题我有多个滑块想要链接到文本框当文本框更改时相应的滑块必须更新为新值反之亦然更改滑块值或文本框时需要调用一个函数该函数使用所有文本框的输入来计算结果我有我的快速但肮脏
从 Google App Engine (Java) 将文件上传到 Google 云存储

如何将文件从谷歌应用程序引擎中的servlet上传到谷歌云存储当我这样做时 Google 云存储不知道文件的类型即我从 HTML 表单发送的文件编写 HTML JavaScript 和 servlet 将文件上传到云存储的正确方法是什
v-dialog Vuetify 的自定义位置

我需要在页面右下角打开一个具有一定宽度和高度的 v 对话框但是我不明白该怎么做 V dialog总是在页面居中我搜索了官方文档尝试使用CSS 但无法有任何想法吗 Note 其他提供的解决方案并不令人满意因为它们搞乱了转换或者我
使用exist()的Cloud firestore规则是否算作读取？

我正在存储被阻止用户的文档集合我通过检查电子邮件是否存在于被阻止的集合中来检查请求是否来自被阻止的用户 allow read if exists databases database documents blocked request a
如何将当前cygwin目录转换为windows格式

显示我正在使用的当前目录 pwd在 Cygwin 中运行良好 This document https cygwin com cygwin ug net using effectively html正在解释如何将 cygwin 目录转换为 w
存储库是单例还是静态还是都不是？

我有一个 ASP NET 网站它使用域驱动设计并使用存储库进行数据库操作我想知道单例存储库和静态存储库以及每次访问都会新增的简单存储库类的优缺点是什么此外如果有人可以比较并指导我使用其中的哪一个我将不胜感激静态和单例对于存储库模
Jquery 验证错误放置（单选按钮）

我正在尝试使用 Jquery 验证插件来验证我的表单我的大多数输入元素的右侧都会出现错误消息但单选按钮只会给我带来麻烦如果我没有给出 div group 类的宽度错误消息会出现在整个页面的外部因为我假设 div 宽度是页面的 10
安装 Shield LE - 错误 6058 ...在 64 位中合并 Visual C++ 10.0 CRT

我正在尝试编译一个安装屏蔽项目这是一个 64 位程序我不断收到此错误尽管它确实编译正常并安装正常 Error 16 6058 Error merging Visual C 10 0 CRT IA64 with module ID C
有没有办法在 swift 中从 utf16 数组创建字符串？

我们知道 String utf16 提供代码单元或 String unicodeScalars 提供标量如果我们通过删除一些元素等来操作 codeunits 和 unicodeScales 有没有办法构造回结果字符串 Swift 2 1
如何更改数据类型而不导致 Haskell 重新编译？

看完一段视频后布雷特维克多的演讲 http vimeo com 36579366 我受到启发编写了一个快速破解程序该程序与他在演讲中演示的开发环境有些相似基本上其想法是让应用程序在一个窗口中运行每当在源文件中保存更改时程序就
猫鼬和 q 承诺

我正在使用 mongoose q Promise 框架示例here https gist github com 2660323 但在尝试使用 findOne 时 nfbind 似乎存在一些问题主要是因为来自Q https github c
如何正确使用文件映射并将数据传递给子进程？

我的应用程序正在执行另一个进程更新程序我想将大数据可能是一条记录从我的应用程序传递到update程序使用命令行传递数据参数不是一个选项因为数据太大而且数据大小可能会有所不同 How to 正确地 create CreateFi
Python 网页抓取：BeautifulSoup 未显示所有 html 源内容

我对网络抓取和Python还很陌生我正在尝试制作一个脚本来获取最后的交易价格但当我用 python 请求时一些内容似乎丢失了我之前制作过从其他网站成功获取数据的脚本但我似乎无法让我的代码在该网站上运行到目前为止这是我的代码 fr

Python 网页抓取：BeautifulSoup 未显示所有 html 源内容

Python 网页抓取：BeautifulSoup 未显示所有 html 源内容 的相关文章

随机推荐

热门标签

Python 网页抓取：BeautifulSoup 未显示所有 html 源内容的相关文章