在Python中，如何解码GZIP编码？

2023-11-26

我在 python 脚本中下载了一个网页。在大多数情况下，这工作得很好。

然而，这个有一个响应头：GZIP 编码，当我尝试打印这个网页的源代码时，它在我的腻子中包含了所有符号。

如何将其解码为常规文本？

我使用 zlib 从网络上解压缩 gzip 内容。

import zlib
import urllib

f=urllib.request.urlopen(url) 
decompressed_data=zlib.decompress(f.read(), 16+zlib.MAX_WBITS)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

http

Text

encoding

ascii

在Python中，如何解码GZIP编码？的相关文章

Python - 比较同一字典中的值

我有一本字典 d Trump MAGA FollowTheMoney Clinton dems Clinton Stein FollowTheMoney Atlanta 我想删除字符串列表中的重复字符串该字符串是键的值对于这个例子期望
为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
ExoPlayer2 - 如何使 HTTP 301 重定向工作？

我开始使用 ExoPlayer 来传输一些音频一切都很顺利直到我遇到一个带有 301 永久移动重定向的 URL ExoPlayer2 默认情况下不处理该问题我已经看过这个线程 https github com google ExoP
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
仅从 PE 文件中提取 .text 部分

我正在尝试从 PE 文件 dll 中提取 text 部分即代码 Linux 或某些 python 或 ruby 库中是否有任何简单的工具可以让我轻松地完成此操作我自己解决了我使用 pefile python 模块提取文本部分并使用
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

将VC++的__try/__ except EXCEPTION_STACK_OVERFLOW移植到MinGW

我正在尝试使用 VC 的 try except 语句将一些代码移植到 MinGW bool success true try except EXCEPTION STACK OVERFLOW GetExceptionCode EXCEPTIO
通过 IdeaVim 在 IntelliJ 中使用 Vim 插件

有没有办法通过 IdeaVim 在 IntelliJ 中使用 Vim 插件在这种情况下我正在寻找一种使用 easymotion Vim 插件的方法您可以使用acejump插件或emacsIDEAs 不要被它的名字吓到它只是介绍了 a
使用 Pandas 从另一个数据帧中删除一个数据帧

我有两个不同大小的数据框 df1 nad df2 我想从中删除df1存储在其中的所有行df2 所以如果我有df2等于 A B 0 wer 6 1 tyu 7 And df1等于 A B C 0 qwe 5 a 1 wer 6 s 2 wer
删除R中tmap中的图例

我有一个简单的问题如何删除 R 中 tmap 中自动添加的图例在这种情况下我想删除右侧描述级别的图例这是我尝试过的 tm shape densities polygons tm polygons col level palett
matlab：将向量划分为固定大小的重叠块

我有一个向量我想将其拆分为大小重叠的子向量cs轮流在sh 想象输入向量是 v 1 2 3 4 5 6 7 8 9 10 11 12 13 A 1 13 given a chunksize of 4 cs 4 和 2 sh 2 结果应如下所
调用未定义函数curl_init()错误

我在 Win 64 位操作系统 php 5 6 8 上使用 Eclipse PDT 来开发 PHP 我遇到过 Call to undefined function curl init 错误我删除了前extension php curl
D3D11：如何绘制简单的像素对齐线？

我尝试用 D3D11 在两个顶点之间画一条线我在 D3D9 和 D3D11 中有一些经验但在 D3D11 中绘制一条线从一个给定像素开始并以另一个像素结束似乎是一个问题我做了什么我向每个顶点的像素坐标添加了 0 5f 以适应纹素
CakePHP如何通过ID数组获取多行

我想根据 ID 数组列表从数据库中提取多行在其他一些框架中似乎有类似 WHERE IN 的东西但这里没有有人可以告诉我该怎么做吗我想知道如何通过 find 或 read 或任何其他 cakephp 函数来做到这一点而不是手动构建
Rails 库包括

关于 lib 目录中定义的模块我有一个令人费解的问题我有两个文件 lib authentication rb module Authentication end lib test module rb module TestModule
HttpServlet 类与 Jersey 一起使用之间的混淆

我正在构建实现 RESTful API 的 servlet 我知道 Jersey 是一个用于破译和使用给定 URL 的框架我如何将它与HttpServlet class 我不明白两者如何相互合作我想这是一个非常笼统的问题但我已经阅读了
Python google Drive API下载，文件在哪里？

我使用此处找到的 python 代码在谷歌驱动器上下载文件 https developers google com drive v3 web manage downloads我有这个范围 https www googleapis com a
GridView.scrollTo() 的解决方法？

如上所述here Android的GridView scrollTo 不起作用解决方案提到的方法 setSelectedPosition 似乎不存在于GridView smoothScrollToPosition确实有效但我真的不想要动
pyqt qt4 QTableView如何禁用某些列的排序？

所以我有一个 QTableView 我只想让列排序在第 1 列而不是第 2 列自然地我尝试installEventFilter on QHeaderView or QTableView but MouseButtonPress事件不会被传
Rails link_to 方法: :delete

我很抱歉问了一个可能是补救问题的问题但在学习 Rails 时我试图遵循本教程中的注释 http guides rubyonrails org getting started html 昨晚我在本教程中发布了一个类似的问题并得到了及时的
Django 模板中的字典

我有这样的看法 info dict u Question 1 13365 13344 u Question 2 13365 u Question 3 for key in info dict for k v in key items pro
JSON.NET 作为 WebAPI 2 OData 序列化器与 ODataMediaTypeFormatter

我正在尝试使用 JSON NET 作为 WebAPI 2 堆栈中的默认序列化器我已经实现了 JsonMediaTypeFormatter 其中使用 JSON NET 序列化器来序列化反序列化数据并创建了 JsonContentNego
Python Inspect.stack 很慢

我只是在分析我的 Python 程序看看为什么它看起来相当慢我发现它的大部分运行时间都花在了inspect stack 方法用于输出带有模块和行号的调试消息每次调用 0 005 秒这看起来相当高是inspect stack真的这
使用 django 表单保存新的外键

我有两个模型 class Studio models Model name models CharField Studio max length 30 unique True class Film models Model studio m
在易出错的初始化程序 swift 1.2 中分配 let 变量

我有一个带有错误初始化程序的结构不是实例方法而是初始化程序更新到 1 2 后当我尝试分配let初始化程序内的属性我收到以下错误Cannot assign to aspectRatio in self 我的代码如下 import F
在Python中，如何解码GZIP编码？

我在 python 脚本中下载了一个网页在大多数情况下这工作得很好然而这个有一个响应头 GZIP 编码当我尝试打印这个网页的源代码时它在我的腻子中包含了所有符号如何将其解码为常规文本我使用 zlib 从网络上解压缩 gzip

在Python中，如何解码GZIP编码？

在Python中，如何解码GZIP编码？ 的相关文章

随机推荐

热门标签

在Python中，如何解码GZIP编码？的相关文章