Python如何获取用zlib压缩的数据的长度？

2024-01-07

我有一个包含多个 zlib 压缩的二进制数据的文件，并且偏移量和长度未知。下面，我有一个脚本，用于获取最终 zlib 压缩数据之后的字节偏移量，这就是我所需要的。脚本有效；但是，为了获得原始 zlib 压缩数据的长度，我必须将其解压缩并重新压缩。有没有更好的方法来获取长度而不必重新压缩它？这是我的代码：

import zlib


def inflate(infile):
    data = infile.read()
    offset = 0
    while offset < len(data):
        window = data[offset : offset + 2]
        for key, value in zlib_headers.items():
            if window == key:
                decomp_obj = zlib.decompressobj()
                yield key, offset, decomp_obj.decompress(data[offset:])
        if offset == len(data):
            break
        offset += 1


if __name__ == "__main__":
    zlib_headers = {b"\x78\x01": 3, b"\x78\x9c": 6, b"\x78\xda": 9}

    with open("input_file", "rb") as infile:
        *_, last = inflate(infile)

    key, offset, data = last
    start_offset = offset + len(zlib.compress(data, zlib_headers[key]))

    print(start_offset)

重新压缩它甚至不起作用。重新压缩的长度可能不同。无法保证结果会相同，除非您首先控制生成压缩数据的压缩过程，并且您可以保证它使用相同的压缩代码、该代码的相同版本以及完全相同设置。 zlib 标头中甚至没有足够的信息来确定压缩级别。顺便说一句，您可能的 zlib 标头列表不完整。可能还有其他 29 个。确定 zlib 流是否从当前字节开始的最简单、最可靠的方法是开始解压缩，直到出现错误或解压缩完成。解压缩器要做的第一件事是检查 zlib 标头的有效性。

要查找解压数据的长度，请输入decomp_obj.decompress()一次固定数量的字节。例如。 65536 字节。跟踪您输入了多少字节。停止时decomp_obj.eof是真的。这表明已到达 zlib 流的末尾。然后decomp_obj.unused_data将是您在 zlib 流之后输入的字节。从喂入的总量中减去剩余部分的长度，就得到了 zlib 流的长度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

zlib

Python如何获取用zlib压缩的数据的长度？的相关文章

(discord.py) 尝试更改成员角色时，“用户”对象没有属性“角色”

因此我正在尝试编写一个机器人让某人在命令中指定的主持人指定的一段时间内暂停角色我知道该变量称为小时即使它目前以秒为单位我稍后会解决这个问题基本上它是由主持人在消息暂停 personmention numberofhours
尽管极其懒惰，但如何在 Python 中模拟 IMAP 服务器？

我很好奇是否有一种简单的方法来模拟 IMAP 服务器例如imaplib模块在Python中 without做很多工作是否有预先存在的解决方案理想情况下我可以连接到现有的 IMAP 服务器进行转储并让模拟服务器在真实的邮箱电子
InterfaceError：连接已关闭（使用 django + celery + Scrapy）

当我在 Celery 任务中使用 Scrapy 解析函数有时可能需要 10 分钟时我得到了这个信息我用姜戈 1 6 5 django celery 3 1 16 芹菜 3 1 16 psycopg2 2 5 5 我也使用了psyc
Pycharm Python 控制台不打印输出

我有一个从 Pycharm python 控制台调用的函数但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面像
如何收集列表、字典等中重复计算的结果（或制作修改每个元素的列表的副本）？

There are a great many existing Q A on Stack Overflow on this general theme but they are all either poor quality typical
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

Java ForkJoinPool 在 JDK17 中挂起

以下代码可重复地与 JDK16 一起使用并在我的笔记本电脑 4 8 核上使用 JDK17 可重复地挂起并使用基本命令行选项 ea 存在 JDK 票证 https bugs openjdk org browse JDK 8281524
如何禁用特定页面中的 Turbolinks？

我遇到一个问题脚本仅在刷新页面时起作用因此我尝试仅针对该页面禁用 Turbolinks 下面的代码不起作用但是如果我将 data no turbolink 属性直接添加到 application html erb 中的 body 标
VSTS 构建未使用 .vdproj 生成 .msi 文件

我有 VSTS Build 它将生成 msi文件使用 vdproj但我没有得到 msi文件退出构建我正在得到Warning MSB4078 The project file abcdSetup abcdSetup vdproj is no
WebLogic 12c - 目标无法访问异常

首先我安装了jdk 1 6 0 43和oracle weblogic 12 1 1 我成功地部署了我的应用程序然后我升级了 jdk 1 7 0 60 和 weblogic 12 1 2 但无法部署我的应用程序现在我降级了我的 web
即使在新页面加载后，仍保持 JavaScript 在浏览器控制台中运行

假设我有一个在控制台中运行的脚本 var counter 0 var i setInterval function perform a number of actions here counter if counter 20 clearIn
Android - 如果未安装应用程序，则重定向到商店（从网站启动）

我们有一个 Android 应用程序当用户重定向到自定义协议时就会启动该应用程序如果用户的设备上未安装该应用程序我们希望用户重定向到该应用程序的 google play 商店对于 iOS 我们使用这样的东西是否可以为 iPhone
Log4j 不使用 JBoss 6.1 进行日志记录

我有一个 JavaEE 应用程序并将其部署在 JBoss 6 1 上我想使用 Log4j 这些是我的依赖项
SQL 计划作业查询，上次运行的持续时间？

以前用过这个SQL 代理作业如何记录 https stackoverflow com questions 5706572 sql agent jobs how to document获取有关所有 SQL 计划作业的信息如何找出每个作业上
嵌套 Case 语句类型错误 (postgres)

我创建的一些 postgres 代码给了我一个错误 ERROR CASE types character varying and numeric cannot be matched CODE CREATE TABLE current con
尝试理解 gcc 在复制返回地址的 main 顶部的复杂堆栈对齐

嗨我已经反汇编了一些我编写的程序 linux 以更好地理解它是如何工作的我注意到 main 函数总是以 lea ecx esp 0x4 I assume this is for getting the adress of the fir
使用自定义框架时出现“Interface Builder 文件中的未知类 BarChartView”错误

我正在尝试使用Charts framework在我的应用程序中我已经使用 Carthage 为此构建了二进制文件并将其添加到我的应用程序中并包含两个文件 Charts Swift h Charts h 然后我将视图的自定义类设置为Ba
如何在 Egit/TortoiseGit 中查看存储库的整个提交历史记录？

我正在寻找一种方法来查看当前 git 存储库的整个历史从表面上看 egit 的 Show in History 只会显示当前提交之前的提交我的意思是如果我执行 commit1 和 commit2 然后决定签出第一个则运行项目的在历
关于UpdatePanel内部？

假设我在页面上有很多重度控制例如我在页面上填充了三个网格视图一个网格视图和按钮位于更新面板内从这个场景我们可以理解页面上会有巨大的视图状态所以我想知道如果我单击更新面板内的按钮那么所有视图状态都将在部分回发期间提交到服务器如
附加属性出现奇怪的 WPF 错误

我看到奇怪的行为我强烈感觉这是 net 工具链中的一个错误重现步骤创建 WPF 应用程序在该解决方案中创建类库在类库中定义一些公共类可以为空在 WPF 应用程序中定义一些带有附加属性的类并将 Window 作为目标类将其附
Picasso IllegalArgumentException 目标不得为 null

我正在尝试在我的项目中使用毕加索库来设置图像当我单击视图的图像时我在毕加索执行中遇到错误应用程序的Logcat java lang IllegalArgumentException Target must not be null at
vue 最奇怪的行为 - 注释代码正在运行

我有一个 vue 项目以 firestore 作为数据库我曾经使用以下功能登录用户 loginUser if this email this password firebase auth signInWithEmailAndPasswo
如何使用 Python 观察和监控新创建文件的 ftp 安装点

我可以使用观看本地目录inotify基于内核子系统的解决方案还有一些 python 项目也在 inotify 之上工作例如pyinotify https github com seb m pyinotify pyInotify http
对 __attribute__((format)) 的自定义支持

GCC 和 Clang 都支持对变量参数函数进行编译时检查例如printf 这些编译器接受如下语法 extern void dprintf int dlevel const char format attribute format pri
应该 validate_format_of 。 not_with 在框架中有问题（或者在我的理解中）

我将以下代码放入 RSpec 测试中 it should validate format of email not with test test 并设置实际的类 validates email presence gt true format
Python如何获取用zlib压缩的数据的长度？

我有一个包含多个 zlib 压缩的二进制数据的文件并且偏移量和长度未知下面我有一个脚本用于获取最终 zlib 压缩数据之后的字节偏移量这就是我所需要的脚本有效但是为了获得原始 zlib 压缩数据的长度我必须将其解压缩并重新

Python如何获取用zlib压缩的数据的长度？

Python如何获取用zlib压缩的数据的长度？ 的相关文章

随机推荐

热门标签

Python如何获取用zlib压缩的数据的长度？的相关文章