pyPdf和pyPdf2在合并pdf时的那个异常

2023-10-31

当一个pdf文件有多page的时候,它将出来见你!偷笑


方法是取直接修改那个文件generic.py


(1)pyPdf

路径大约在这里:

/usr/lib/python2.7/site-packages/pyPdf/generic.py

if data.has_key(key):
      # multiple definitions of key not permitted
      raise utils.PdfReadError, "multiple definitions in dictionary"
data[key] = value


大约在532--536行

将它修改为:

if not data.get(key):

    data[key] = value


(2)pyPdf2

路径大约在:

/usr/lib/python2.7/site-packages/PyPDF2/generic.py

if not data.get(key):
     data[key] = value
elif pdf.strict:
     # multiple definitions of key not permitted
     raise utils.PdfReadError("Multiple definitions in dictionary at byte %s for key %s" \
                                            % (utils.hexStr(stream.tell()), key))

修改为:

if not data.get(key):
     data[key] = value




本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pyPdf和pyPdf2在合并pdf时的那个异常 的相关文章

  • 使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

    我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败 这是在运行的虚拟机上 Ubuntu 8 04 32 位 当我使用时会发生这种情
  • 没有名为 crypto.cipher 的模块

    我现在正在尝试加密一段时间 我最近得到了这个基于 python 的密码器 名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生 当我尝试通过终端打开 C
  • Django 代理模型的继承和多态性

    我正在开发一个我没有启动的 Django 项目 我面临着一个问题遗产 我有一个大模型 在示例中简化 称为MyModel这应该代表不同种类的物品 的所有实例对象MyModel应该具有相同的字段 但方法的行为根据项目类型的不同而有很大差异 到目
  • Python - StatsModels、OLS 置信区间

    在 Statsmodels 中 我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
  • 如何在 Python 中检索 for 循环中的剩余项目?

    我有一个简单的 for 循环迭代项目列表 在某些时候 我知道它会破裂 我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
  • 根据列值突出显示数据框中的行?

    假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
  • 是否可以忽略一行的pyright检查?

    我需要忽略一行的pyright 检查 有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
  • 使用 Tkinter 显示 numpy 数组中的图像

    我对 Python 缺乏经验 第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果 当图像来自 numpy 数组而不是我的 PC 上的文件路径时 我有一个关于在 Tkinter 中显示图像的问题 我为
  • 从 Flask 访问 Heroku 变量

    我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
  • 如何在ipywidget按钮中显示全文?

    我正在创建一个ipywidget带有一些文本的按钮 但按钮中未显示全文 我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
  • IO 密集型任务中的 Python 多线程

    建议仅在 IO 密集型任务中使用 Python 多线程 因为 Python 有一个全局解释器锁 GIL 只允许一个线程持有 Python 解释器的控制权 然而 多线程对于 IO 密集型操作有意义吗 https stackoverflow c
  • 在f字符串中转义字符[重复]

    这个问题在这里已经有答案了 我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
  • 使用 \r 并打印一些文本后如何清除控制台中的一行?

    对于我当前的项目 有一些代码很慢并且我无法使其更快 为了获得一些关于已完成 必须完成多少的反馈 我创建了一个进度片段 您可以在下面看到 当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
  • 如何在Python中对类别进行加权随机抽样

    给定一个元组列表 其中每个元组都包含一个概率和一个项目 我想根据其概率对项目进行采样 例如 给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样 在 python 中执行此操作的规范方法是什么 我查看了 random 模
  • Fabric env.roledefs 未按预期运行

    On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
  • 对年龄列进行分组/分类

    我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
  • Conda SafetyError:文件大小不正确

    使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
  • 使用 Python 绘制 2D 核密度估计

    I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
  • 从列表指向字典变量

    假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在 我需要的是一个常规 看到该值后 在 b 的位置内读写一个值 我不喜欢复制变量 我想直接改变变量b的内容 假设b是一个嵌套字典 你可以这样做 reduce di
  • Statsmodels.formula.api OLS不显示截距的统计值

    我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

  • 图像数据集整理汇总(包含ImageNet、旷视、VOC、COCO等等)

    链接 https pan baidu com s 1t8mQQzXJvxSA8GcCXbNIhA 提取码 pys8 ImageNet https image net org download php 旷视CrowdHuamn数据集 http
  • Kafka3.0.0版本——增加副本因子

    目录 一 服务器信息 二 启动zookeeper和kafka集群 2 1 先启动zookeeper集群 2 2 再启动kafka集群 三 增加副本因子 3 1 增加副本因子的概述 3 2 增加副本因子的示例 3 2 1 创建topic 主题
  • 计算机网络 谢希仁 课后习题部分答案

    试说明IP地址与硬件地址的区别 为什么要使用这两种不同的地址 解 IP地址放在IP数据报的首部 硬件地址则放MAC帧的首部 在网络层和网络层以上使用IP地址 数据链路层及以下使用硬件地址 IP 地址就是给每个连接在因特网上的主机 或路由器
  • aspose操作文档

    操作aspose版本 aspose words 21 4 官网下载地址 https releases aspose com words java 问题 1 每次操作文档的时候都要重新保存 不然文件损坏 打开的文件就是乱码的 记录一些简单的功
  • RobotFramework环境配置七:多浏览器兼容性测试(1)

    多浏览器兼容性测试 1 RIDE已经支持多浏览器兼容性测试 例如 firefox ie chrome safari 但是 项目要求支持360极速和360安全浏览器 所以 我们需要增加代码让RIDE识别 其他浏览器类似 本地浏览器 说明 基于
  • 电源完整性的很好的解释

    电源和地层大块平面间构成了谐振腔 高速数字信号经过时 犹如快艇在湖面掀起一阵波浪 电源地之间电压起了波动 既然是谐振 机械上叫共振 就要固有频率 这个固有频率是与电源和地平面的形状 中间的介质参数 介电常数 损耗 厚度 有关系的 一旦这些参
  • 1、Django使用Bootstrap

    1 Django使用Bootstrap 学习一段时间Django后 想写一个博客 CSS框架使用Bootstrap 但是将bootstrap css源文件拷贝到到app static css下后 发现无任何效果 百思不得其解 郁闷了一天后
  • 数据结构知识整理

    标题2020 1024 996 你品 你细品 堆 栈 队列 大根堆小根堆 大根堆 堆顶的元素是最大的 越往下越小 小根堆 堆顶的元素是最小的 越往下越大 大根堆小根堆的声明 priority queue
  • 通过超链接 解析zip压缩包 中的 xml 内容

    import com alibaba fastjson JSON import com api zp documentexchange OkHttp import okhttp3 OkHttpClient import okhttp3 Re
  • Eigen与cuda兼容问题解决

    1 报错 usr include eigen3 Eigen src Core arch CUDA Half h 596 error no suitable constructor exists to convert from float t
  • 源码解析(一):Spring JDBC如何实现多数据源

    Spring JDBC如何实现多数据源 背景 类介绍 bean初始化设置属性 1 AbstractRoutingDataSource 属性 2 初始化设置 设置当前lookupKey 1 获取 lookupKey 2 找到目标数据源 获取连
  • kali自动化渗透神器websploit模块介绍

    websploit 安装websploit root kali2 apt get install websploit root kali2 websploit db d8b db d88888b d8888b d8888 d8888b db
  • Linux操作系统下如何查看磁盘的queue_depth(队列深度),安排!

    Linux中的queue depth 队列深度 可以用lsscsi查看 lsscsi l 0 0 1 0 disk FUJITSU MAM3184MP 0105 dev sda state running queue depth 16 sc
  • Eureka服务注册与发现

    Eureka服务注册与发现 1 什么是Eureka 2 Eureka原理 3 对比Zookeeper 1 什么是Eureka Eureka是Netflix的子模块 Eureka是一个基于Rest的服务 用于定位服务 以实现云端中间层服务发现
  • 【无公网IP内网穿透】异地远程访问本地SQL Server数据库

    目录 1 前言 2 本地安装和设置SQL Server 2 1 SQL Server下载 2 2 SQL Server本地连接测试 2 3 Cpolar内网穿透的下载和安装 2 3 Cpolar内网穿透的注册 3 本地网页发布 3 1 Cp
  • MNIST数据集下载与保存为图片格式

    文章目录 MNIST 数据集下载 与 保存为图片格式 1 MNIST数据集 2 保存为图片格式 MNIST 数据集下载 与 保存为图片格式 1 MNIST数据集 下载地址 http yann lecun com exdb mnist 获得文
  • 【Java基础】Java中数组详解(含数组内存的解析)

    一 数组概述 1 数组的理解 数组 Array 是多个相同类型数据按照一定顺序排列的集合 并能使用一个名字命名 并通过编号的方式对这些数据进行统一的管理 2 数组的相关概念 数组名 元素 角标 下标 索引 三个词是一个意思 数组的长度 元素
  • idea实用插件Free MyBatis plugin、Maven Helper、GsonFormat和快速生成maven依赖技巧

    1 Free MyBatis plugin 这个插件主要实现了mapper和xml的快速跳转 不用每次查找sql的时候全局搜索了 安装过程不多说 这个插件介绍如下 常用的就是第二个功能 快速从xml代码跳转到mapper文件和从mapper
  • ElementUI浅尝辄止18:Avatar 头像

    用图标 图片或者字符的形式展示用户或事物信息 常用于管理系统或web网站的用户头像 在用户账户模块更换头像操作也能看到关于Avatar组件的应用 1 如何使用 通过 shape 和 size 设置头像的形状和大小
  • pyPdf和pyPdf2在合并pdf时的那个异常

    当一个pdf文件有多page的时候 它将出来见你 方法是取直接修改那个文件generic py 1 pyPdf 路径大约在这里 usr lib python2 7 site packages pyPdf generic py if data