为什么 urllib.urlopen.read() 与源代码不对应?

2023-11-26

我正在尝试获取以下网页:

import urllib
urllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()

结果与我使用 Google Chrome 检查网页源代码时看到的不符。

您能告诉我为什么会发生这种情况以及如何改进我的代码来克服这个问题吗?

感谢您的帮助。


你从中得到什么urlopen是原始网页,意味着没有执行 javascript,不使用 css;你从 Chrome(或其他浏览器)获得的是最终网页,其中包括可执行的 javascript(可能会改变 HTML)、CSS 渲染等。所有这些都不会发生在urlopen...

因此存在差异,希望这一点很清楚

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 urllib.urlopen.read() 与源代码不对应? 的相关文章

随机推荐

  • 将文档作为参数传递给 Java 中的 XSL Translation

    我正在为我的 XSL 添加国际化功能 我见过很多创建dictionary xml 文件并通过document dictionary xml 将其加载到我的XSL 中的示例 我想做类似的事情 但我不想在磁盘上创建和存储dictionary x
  • Bootstrap 4 卡列宽度

    我正在使用文档中的代码创建一个包含 3 4 张卡片的卡片列布局 我只从一个开始 这是我的代码 div class card columns div class card img class card img top img fluid sr
  • 如何设置 PHP 回显文本的样式? [关闭]

    Closed 这个问题需要细节或清晰度 目前不接受答案 我有以下代码
  • iOS facebook sdk 如何下载相册、个人资料照片数据

    我想让我的 iPhone 应用程序用户查看并从他们的 Facebook 个人资料照片中选择 下载照片以用作个人资料图片 我目前正在使用Facebook SSO SDK并成功登录并访问Graph信息 已尝试使用以下方式访问照片信息 成功 SS
  • 如何获取重定向UDP报文的原始目的端口?

    Using 这东西我可以获得原始目的IP地址socket PF INET SOCK DGRAM 0 socket 如何获取原目的港 取决于重定向机制 如果您使用 REDIRECT 即底层的 NAT 则需要使用 SO ORIGINAL DST
  • 如何将 javascript 文件的服务限制为仅向经过身份验证的用户提供?

    我有一个 WebAPI 2 AngularJS SPA 应用程序 它使用 Identity 2 进行身份验证 我的代码在本地存储一个用于身份验证的令牌 我想实现一个功能 允许我的应用程序在下载初始 index html 页面后为经过身份验证
  • 游戏开发入门

    我想开始游戏开发 我读了很多文章 但没有走得太远 我正在学习计算机科学 并且有 C 经验 一个学期的 Java NET 甚至汇编程序 但我不会从那开始 我想开发 小型 游戏 例如俄罗斯方块 以及后来的某种跳跃和奔跑 我想从事视觉方面的工作
  • R:在 foreach %dopar% 中显示错误和警告消息

    我刚开始使用 foreach dopar 进行并行 并且对于它如何处理错误或警告有一些问题 当我在 foreach dopar 中使用 try 和自定义错误消息时 本机 错误消息不会显示 test lt function x if x 2
  • Java中的隐藏方法是什么?甚至 JavaDoc 的解释也令人困惑

    Javadoc says 调用的隐藏方法的版本是超类中的版本 调用的重写方法的版本是子类中的版本 没有给我敲响警钟 任何显示其含义的清晰示例都将受到高度赞赏 public class Animal public static void fo
  • 如何在 Knex where like 查询中转义 %?

    我在用着knex生成我的 SQL 查询 在knex文档 它显示了这一点 knex users where columnName like rowlikeme 现在在我的应用程序中 我这样做了 function search term ter
  • 可以在应用程序内购买 iOS 7 模拟器吗? [关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 看来苹果再次拿走了ios 7模拟器来测试应用内购买的权利 我的游戏在其他版本的 ios 模拟器上运行良好 可以在应用程序购买中进行测试 但突然它在 ios 7 模拟器上停止 并抛出错
  • 如何升级到 C++17?

    我使用 Atom 作为我的 IDE 我当前的 cplusplus 201402这是 C 14 我的编译器是g 海湾合作委员会 9 2 0 如何升级到 C 17 或 C 20 我搜索到的所有内容都涉及使用另一个 IDE Microsoft V
  • 检测基于纬度/经度的多边形中的点

    我想在服务器端仅使用 C 检测基于纬度 经度的坐标是否位于由基于纬度 经度的点组成的区域 多边形 内 我相信正确的方法是光线投射 但也许已经有一个 C 实现了 因为它并不简单 另外 我知道 SQL Server 有一些几何函数 例如STIn
  • 解析 Joda 时间部分

    我想从字符串生成部分 但在 API 中找不到任何支持该功能的内容 显然 我可以在 Joda Time 框架之外编写自己的解析器并创建 Partials 但我无法想象 API 尚不具备执行此操作的能力 使用 Threeten JSR 310
  • java.sql.SQLException:此驱动程序不支持 SQL Server 版本 8。 SQL 状态 = 08S01,错误代码 = 0

    我已将我的应用程序升级到Websphere 7 0from Websphere 6 1 我在用Microsoft SQL server jdbc driver 4 0对于这个应用程序 当我使用sqljdbc4 jar连接到数据库进行身份验证
  • 如何使用 pandas 从 Word 文档 (.docx) 文件中的表创建数据框

    我有一个带有数据表的word文件 docx 我正在尝试使用该表创建一个pandas数据框 我使用了docx和pandas模块 但我无法创建数据框 from docx import Document document Document req
  • 使用 char(36) 类型对第一列进行编码

    所以我有一个 UserProfile 模型类作为 SimpleMembership 的一部分 在其中 我需要存储存在于另一个类型的数据库中的遗留标识符char 36 我很想将其更改为更明智的内容 例如 uniqueIdentifier 但这
  • Spring Security:如何以编程方式清除“记住我”cookie?

    我在网络应用程序中使用注销方法 如下所示 但如果我检查remember me注销不起作用 因为 cookie 未清除 如何在我的方法中以编程方式清除此 cookie 或如何制定更好的注销方法 public void logout Anony
  • 使用 setAs() 在 R 中指定 colClasses 时收到警告 [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 我尝试使用这里提供的答案 Greg Snowquest
  • 为什么 urllib.urlopen.read() 与源代码不对应?

    我正在尝试获取以下网页 import urllib urllib urlopen http www gallimard jeunesse fr searchjeunesse advanced order author catalog 0 1