使用 Pycurl 获取 HTML

2024-01-11

我一直在尝试使用 pycurl 检索 HTML 页面，因此我可以使用 str.split 和一些 for 循环解析它以获取相关信息。我知道 Pycurl 检索 HTML，因为它将它打印到终端，但是，如果我尝试做类似的事情

html = str(c.perform())

该变量仅保存一个表示“None”的字符串。

如何使用 pycurl 获取 html，或重定向它发送到控制台的任何内容，以便它可以用作如上所述的字符串？

非常感谢任何有建议的人！

这将发送请求并存储/打印响应正文：

from StringIO import StringIO    
import pycurl

url = 'http://www.google.com/'

storage = StringIO()
c = pycurl.Curl()
c.setopt(c.URL, url)
c.setopt(c.WRITEFUNCTION, storage.write)
c.perform()
c.close()
content = storage.getvalue()
print content

如果要存储响应标头，请使用：

c.setopt(c.HEADERFUNCTION, storage.write)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pycurl

使用 Pycurl 获取 HTML 的相关文章

Python 类型提示 Dict 语法错误可变默认值是不允许的。使用“默认工厂”

我不知道为什么解释器会抱怨这个类型的字典对于这两个实例我得到一个不允许可变默认值使用默认工厂语法错误我使用的是 python 3 7 3 from dataclasses import dataclass from typing
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
在 Django Admin 中调整字段大小

在管理上添加或编辑条目时 Django 倾向于填充水平空间但在某些情况下当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时这确实是一种空间浪费字符宽然后编辑框最多可容纳 15 或 20 个字符我如何告
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

如何使soapUI 附件路径相对？

我正在使用soapUI 来测试HTTP 服务器我需要发送一个多部分表单数据请求当我通过文件选择器并附加它时该请求工作正常但它将路径保存为绝对路径并且我需要保存相对于我的测试文件的路径但没有缓存在我的测试文件中我怎样才能做到这
UITableViewCell 与 UIImage，宽度未更新初始显示的单元格

我想动态调整 UITableViewCell 内 UIImage 的宽度我使用情节提要来设计 UITableViewCell 我刚刚添加了一个标签和一个图像属性得到正确更新我什至加载了将宽度放入标签以显示它是正确的值对于图像我正在
Hadoop MapReduce 与 MPI（与 Spark、Mahout 与 Mesos） - 何时使用其中之一？

我是并行计算新手刚刚开始在 Amazon AWS 上尝试 MPI 和 Hadoop MapReduce 但我对何时使用其中一种而不是另一种感到困惑例如我看到的一个常见的经验法则可以总结为大数据非迭代容错 gt MapReduce
docker-machine 和 docker-compose 有什么区别？

我想我不明白首先我创建了 docker machine docker machine create d virtualbox dev eval docker machine env dev 然后我编写了 Dockerfile 和 doc
MVC 区域 - 非区域路由解析为区域

我已在我的 MVC 3 项目中添加了一个区域我似乎无法在非常简单的场景中使用路由看来总是想去区解决一下这是我的配置启动时 AreaRegistration RegisterAllAreas IgnoreRoute resource
HTML5：输入类型持续时间

有没有办法使用输入类型持续时间我正在尝试以某种方式进行输入用户可以添加类似这样的持续时间06 30 27 15 hh mm ss ms 并且应该只允许 0 23 0 59 0 59 0 59 任何帮助表示赞赏 NOTE 我想在 Angu
TypeError: jQuery(...).validate 不是一个函数

我将动态 html 内容添加到另一个 html 内容上这基本上是一个编辑表单 html 视图但是当我尝试验证 from 时它给出了 TypeError jQuery validate is not a function 错误我使用的
conda 'base' 和 'root' 环境有什么区别？

我最近一直在努力组织我的 conda 环境我最终重新安装了 miniconda 现在一切顺利我的问题是当我跑步时conda env list I get conda environments base Users rheft mini
是否有即将推出的 Cloud Spanner 框架？

我开始研究 Google 的 Cloud Spanner 它看起来确实很有趣由于ruby有rails MongoDB有Meteor RethinkDB有Horizo n 是否有关于Cloud Spanner拥有某种专用框架的讨论或者是否
在近实时分析中，为什么 Lambda-->Firehose-->S3 优于 Lambda-->S3？

许多用于无服务器实时分析的 AWS 参考架构建议通过 Kinesis Firehose 将处理后的数据从 Lambda 推送到 S3 e g https aws amazon com blogs big data create real t
PHP mail() 仅发送给单个收件人

我正在为客户端更新一些非 PHP 相关页面这些页面将表单输入发送到 PHP 但是如果不对代码进行任何更改客户端就会报告没有收到电子邮件相反他说它只向其中一封电子邮件发送电子邮件而不是向所有 3 封电子邮件发送电子邮件有人能指出
如何使用 Mongoid 查看原始 mongoDB 查询

我按照此页面查看了 mongoDB 查询结果我可以看到轻便摩托车日志但我看不到原始的 mongoDB 查询如何在 Rails 控制台服务器中显示 MongoDB 查询 https stackoverflow com question
在 /proc/net 中创建 ProcFS 条目

我尝试在里面创建一个条目 proc net来自内核模块如下所示 struct file filp filp open proc net O RDONLY 0 struct proc dir entry parent PDE filp gt
Rails 在 grouped_collection_select 中选择一个字段

I m using this code in my view to create a selection grouped collection select query city id states cities name id name
Adobe Acrobat Pro XI - 将 Javascript 添加到 PDF

这似乎是一个非常新手的问题但我一整天都在为这个问题绞尽脑汁我正在运行 Adob e Acrobat Professional XI 的试用版我希望将简单的 JavaScript 添加到 PDF 文件中目的是创建一个 PDF 文件打
帮助比较 argv 字符串

I have int main int argc char argv if argc 2 printf Mode of Use copy ex1 n return 1 formatDisk argv void formatDisk char
MVC 中的验证规则和业务规则

我有一个 MVC Web 项目根据最佳实践添加验证规则和业务规则的正确位置在哪里验证规则将是必填字段和必填格式商业规则将是该电子邮件已被存入数据库这是我目前正在做的注册模型 public class RegisterModel
基于 BGL 的新类中的自定义函数 addEdge 的返回值应该是多少？

我尝试实现一个基于的图形类https stackoverflow com a 950173 7558038 https stackoverflow com a 950173 7558038 添加边缘时我返回所添加边缘的边缘描述符但如果边
Android：检查互联网是否有可用网络

我使用此代码来检查网络连接 public boolean isOnline ConnectivityManager cm ConnectivityManager getSystemService Context CONNECTIVITY S
使用 Pycurl 获取 HTML

我一直在尝试使用 pycurl 检索 HTML 页面因此我可以使用 str split 和一些 for 循环解析它以获取相关信息我知道 Pycurl 检索 HTML 因为它将它打印到终端但是如果我尝试做类似的事情 html str

使用 Pycurl 获取 HTML

使用 Pycurl 获取 HTML 的相关文章

随机推荐

热门标签