如何使机械化不会因该页面上的表单而失败？

2024-01-09

import mechanize

url = 'http://steamcommunity.com'

br=mechanize.Browser(factory=mechanize.RobustFactory())

br.open(url)
print br.request
print br.form
for each in br.forms():
    print each
    print

上述代码的结果是：

Traceback (most recent call last):
  File "./mech_test.py", line 12, in <module>
    for each in br.forms():
  File "build/bdist.linux-i686/egg/mechanize/_mechanize.py", line 426, in forms
  File "build/bdist.linux-i686/egg/mechanize/_html.py", line 559, in forms
  File "build/bdist.linux-i686/egg/mechanize/_html.py", line 228, in forms
mechanize._html.ParseError

我的具体目标是使用登录表单，但我什至无法让 mechanize 识别出有任何表单。甚至用我认为最基本的选择方法any form, br.select_form(nr=0)，导致相同的回溯。如果有区别的话，表单的 enctype 是 multipart/form-data 。

我想这一切都归结为一个由两部分组成的问题：我怎样才能让机械化处理这个页面，或者如果不可能，那么在维护 cookie 的同时还有什么其他方法？

编辑：如下所述，这将重定向到“https://steamcommunity.com https://steamcommunity.com'.

Mechanize 可以成功检索 HTML，如以下代码所示：

url = 'https://steamcommunity.com'

hh = mechanize.HTTPSHandler()  # you might want HTTPSHandler, too
hh.set_http_debuglevel(1)
opener = mechanize.build_opener(hh)
response = opener.open(url)
contents = response.readlines()

print contents

您是否提到该网站正在重定向到 https (ssl) 服务器？

好吧，尝试设置一个新的 HTTPS 处理程序，如下所示：

mechanize.HTTPSHandler()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Automation

screenscraping

mechanize

如何使机械化不会因该页面上的表单而失败？的相关文章

操作数无法与形状 (128,) (0,) 错误一起广播

我正在尝试实现面部识别登录系统但出现错误操作数无法与形状 128 0 一起广播我不知道什么或如何解决它这是我已实现的 view py 和 FaceDetector py 以及我从服务器收到的错误 errors Traceback m
具有多处理功能的 Python 代码无法在 Windows 上运行

以下简单的绝对初学者代码在 Ubuntu 14 04 Python 2 7 6 和 Cygwin Python 2 7 8 上运行 100 但在 Windows 64 位 Python 2 7 8 上挂起我使用另一个片段观察到了同样的情况
Python Nose 导入错误

我似乎无法理解鼻子测试框架 https nose readthedocs org en latest 识别文件结构中测试脚本下方的模块我已经设置了演示该问题的最简单的示例下面我会解释一下这是包文件结构 init py foo py t
底图上的子图

我有一张英国地图和 121 个地点每个地点有 3 个值我想绘制 121 个位置中每个位置的三个值的小条形图目前这些值绘制为markersize属性看起来像这样密集恐惧症情节 https i stack imgur com 5fv
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
Python，将迭代函数变成递归函数

我创建了一个输出 4 3 2 1 0 1 2 3 4 的迭代函数 def bounce2 n s n for i in range n print n n n 1 if n lt 0 for i in range s 1 print n n
寻找 WebElements，最佳实践

在我们当前的自动化使用 Selenium WebDriver Java 中我们使用 FindBy very广泛地例如 FindBy css a name bcrumb protected List
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
在Python中删除带有重音符号的字符串中的所有非字母字符

我正在尝试使用 Python 3 7 从包含重音符号的字符串中删除所有非字母字符空格除外我尝试了以下方法 import re text 29 1981 4 2008 clean text re sub W d text print cl
如何在 Python 中从 HTML 页面中提取 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我必须用Python 编写一个网络爬
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
在Python 3.2中，我可以使用http.client打开并读取HTTPS网页，但urllib.request无法打开同一页面

我想打开并阅读https yande re https yande re with urllib request 但我收到 SSL 错误我可以使用以下方式打开并阅读页面http client用这个代码 import http client
从数据集的给定日期范围中提取属于一天的数据

我有一个数据集日期范围为 2018 年 1 月 12 日到 8 月 3 日其中包含一些值维数为my df数据框是 my df shape 9752 2 每行包含半小时频率第一行开始于2018 01 12 my df iloc 0 D

随机推荐

从 Google Cloud Function 设置 Firebase Storage 的位置路径？

我正在努力从 Google Text to Speech 获取音频文件然后将该文件写入 Firebase Storage 我不明白在哪里指定存储中位置的路径我试过 const bucket storage bucket myProjec
如何根据字符串匹配选择 R 数据框中的列

我不认为这个exact问题已经被问过无论如何对于R 我想保留数据集中包含特定字符串的任何列实际上有数百列并删除其余的列我发现了很多字符串搜索列的例子names 但对列本身的内容没有任何影响举个例子假设我有这个数据集 df da
mysql命令行返回执行时间？

我正在使用 mysql 命令在 Linux 主机上工作我有一个运行批处理 mysql 命令的脚本例如mysql e select 并且我希望总结每个命令的执行时间有没有办法从命令行获取 mysql 执行时间例如在mysql交互模式
用kivy按下按钮时如何更改空格？

我正在尝试通过实现以下模板来创建一个 GUI漫画创作者图形用户界面 https www packtpub com packtlib book Application Development 9781785286926 1 ch01lvl1s
如何使用直骨架计算多边形的斜接偏移

我有一个用 Python 实现的 Straight Skeleton 算法想用它来偏移多边形的边缘我看过几篇提出这种抵消方法的论文遗憾的是它们都没有提供有关如何实现它的具体信息他们之中带孔简单二维多边形直骨架的 CGAL 实现 h
如何计算给定数据结构中列的平均值？

我有以下数据结构ds AD TYPE B TYPE D array 84 0 85 0 115 0 dtype object array 31 0 23 0 599 0 dtype object array 75 0 21 0 nan dt
高度为 1fr 的单行网格未填充 Chrome 中的高度

我在 Flexbox 列内有一个 CSS 网格并且该网格具有flex grow 1 在 Chrome 中网格会扩展以填充可用空间但其内容不会扩展即使使用align content stretch在网格上在 Firefox 和 Ed
DrawToBitmap - System.ArgumentException：参数无效

我正在创建一个Label有时我使用 DrawToBitmap 我不知道为什么但是在我运行我的程序一段时间后并调用 DrawToBitmap 经常我得到例外 System ArgumentException Parameter is n
nginx：[emerg]此处不允许“服务器”指令

我已经重新配置了 nginx 但无法使用以下配置重新启动它 server listen 80 server name www example com return 301 scheme example com request uri ser
Laravel 连接数据库时超时

我正在将应用程序从我的开发计算机移动到测试服务器当连接到我的本地开发 mysql 数据库时一切都按预期进行当尝试连接到我们的测试服务器时请求在 45 秒后超时并返回 500 错误我测试了服务器可以通信并且php可以使用基本的my
通过 API 确定是否为用户启用 Google 2 因素身份验证

我想开发一个使用 Google 作为身份验证提供程序的应用程序但我希望我的应用程序在帐户注册到我的应用程序之前知道 Google 帐户是否正在使用两步验证在 Google 开发文档中找不到所需的 API This answer http
layoutAttributesForSupplementaryViewOfKind:atIndexPath: 传入不正确的indexPath

我有一个习惯UICollectionViewLayout它使用补充视图将页脚放置在每个页面的底部这似乎一直运作良好直到我开始在页面底部插入单元格由于补充视图必须链接到 UICollectionView 中的 NSIndexPath 因
ASP.NET：Response.Redirect(...) 之后代码会发生什么？

Response Redirect 是否会导致当前正在运行的方法中止或者 Response Redirect 之后的代码也执行吗也就是说在Response Redirect之后是否需要返回退出Sub Response Redirec
如何通过 Qt 5.6 将 QML 应用程序窗口设置为透明？

我是 Qt 和 QML 的新手现在我设置了一个窗口并希望将其设置为透明用户可以在我的应用程序中看到我的桌面我尝试使用WA TranslucentBackground and opacity 但是它不起作用这是我的 QML 代码非常
如何在swift中将字节数组转换为base64字符串？

这是我在 Objective C 中的示例代码 NSString getImageString unsigned char charValue unsigned long sizeOfBytes uint8 t commandbyte ui
scipy：插值轨迹

我有一个由一系列序列形成的轨迹 x y 对我想使用样条曲线在该轨迹上插入点我该怎么做呢使用scipy interpolate UnivariateSpline不起作用因为两者都没有x nor y是单调的我可以引入参数化例如长度d
将数据从一页发送到另一页

我正在尝试使用 C ASP Net 将表单数据从一个页面发送到另一个页面我有两个页面default aspx和default2 aspx 这是我在default aspx中的代码
Spring 通过自定义身份验证提供程序记住我

我想为我的应用程序实现记住我服务我面临的主要问题是我正在使用自定义身份验证提供程序它使用第三方应用程序进行身份验证我无法直接访问他们的数据库我检查了这个Link https stackoverflow com questions 7
FFMPEG + Android 包装器使用 FFMPEG 的最新版本

我正在尝试编译 FFMPEG 以与我的 Android 应用程序一起使用我看过 https github com halfninja android ffmpeg x264 https github com halfninja andro
如何使机械化不会因该页面上的表单而失败？

import mechanize url http steamcommunity com br mechanize Browser factory mechanize RobustFactory br open url print br r

如何使机械化不会因该页面上的表单而失败？

如何使机械化不会因该页面上的表单而失败？ 的相关文章

随机推荐

热门标签

如何使机械化不会因该页面上的表单而失败？的相关文章