使用 python-docx 从 .docx 文件中提取图像位置

2023-11-26

我正在尝试使用以下命令从 .docx 文件中获取图像索引python-docx图书馆。我能够提取图像的名称、图像的高度和宽度。但不是它在word文件中的索引

import docx
doc = docx.Document(filename)
for s in doc.inline_shapes:
    print (s.height.cm,s.width.cm,s._inline.graphic.graphicData.pic.nvPicPr.cNvPr.name)

output

21.228  15.920 IMG_20160910_220903848.jpg

事实上我想知道是否有更简单的方法来获取图像名称，例如s.身高.cm给我带来了以厘米为单位的高度。我的主要要求是了解图像在文档中的位置，因为我需要提取图像并对其进行一些处理，然后再次将图像放回同一位置

API 不直接支持此操作。

但是，如果您愿意深入了解内部原理并使用底层lxmlAPI 是可以的。

一般方法是访问ImagePart与要检查和修改的图片对应的实例，然后读写._blob属性（以字节形式保存图像文件）。

此 XML 样本可能会有所帮助：http://python-docx.readthedocs.io/en/latest/dev/analysis/features/shapes/picture.html#specimen-xml

从包含图片的内联形状中，您可以得到<a:blip>元素与此：

blip = inline_shape._inline.graphic.graphicData.pic.blipFill.blip

关系 id（通常为 r:id，但在本例中为 r:embed）可在以下位置获得：

rId = blip.embed

然后就可以从文档部分获取图像部分

document_part = document.part
image_part = document_part.related_parts[rId]

然后二进制图像就可以读取和写入了._blob.

如果您写入一个新的 blob，它将在保存时替换之前的图像。

您可能希望让它处理单个图像并在扩展到单个文档中的多个图像之前先感受一下它。

可能会缓存一两个图像特征，因此在保存并重新加载文件之前，您可能无法获得所有细节，因此请对此保持警惕。

正如您所看到的，不适合胆小的人，但如果您非常想要它并且可以稍微跟踪一下代码，那么应该可以工作:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pythondocx

使用 python-docx 从 .docx 文件中提取图像位置的相关文章

用于将 cython 中的许多 C++ 类包装到单个共享对象的项目结构

我在文档邮件列表和这个问题在这里 https stackoverflow com questions 10300660 cython and distutils 但我想得到一个更直接的答案来解决我的具体情况我正在通过尝试一点一点地包装我
Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

IOS的文件系统加密？

我知道在Mac OS上我们可以使用Macfuse在用户空间中编写文件系统我们可以创建一个盒子加密我不知道IOS上有一个框架像FUSE Macfuse这样的库我可以编写我的文件系统来加密解密文件可能安装在目录文件夹上谁能给我
DocumentDb 错误“跨分区查询仅支持聚合的‘VALUE ’”

我很困惑我将以下 SQL 查询发送到我的 documentDb 实例 query SELECT SUM c clicks SUM c opens MAX c ts COUNT c FROM c WHERE c clicks gt 0 我收
如何使用 Javascript 找出两个日期之间的差异

我想获得特定日期的扩孔天数所以我试图用今天的日期检测特定日期但这在这里不起作用是我的code如果日期是下个月 27 我怎样才能得到剩余的天数 var date2 new Date var date1 27 5 2012 var diff
从 CMRotationMatrix 获取俯仰、偏航、滚转

我有一个 CMRotationMatrix rot 我想从矩阵中获取俯仰偏航滚转我有什么想法可以做到这一点吗 Thanks 使用四元数比使用欧拉角更好可以使用以下公式从四元数导出横滚角俯仰角和偏航角值 roll atan2 2 y
如何从c中数字的最高有效位开始获取不同的数字？

我正在解决一个问题其中给出一个正整数并且我必须用文字显示它例如如果一个数字是2134输出应该是 two one three four 如果我使用模运算符并使用递归技术我会从最低有效数字开始得到数字即 four three one
奇怪：按下按钮后 WinForms 窗体自动关闭

我的应用程序是 WinForms NET 4 C 其中一个表单在按下按钮后会自动关闭该表单确实有默认的接受和取消按钮但这些按钮未被触及有一个 ButtonTestConnection Click 事件当单击该事件时它会完成
未解析的外部符号“public：__thiscall [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我已经看过我知道还有其他答案但似乎没有一个答案能给
是否可以通过 VBA 检查文件是否存在于共享点站点上？

我正在尝试编写一个 Excel 2010 宏该宏在某些时候必须确认公司共享点网站上是否存在某个文件 doc pdf 该文件可通过 Internet Explorer 访问所有权限均授予用户我有该文件的直接链接我不需要打开它只需检查
将实时镜头从摄像机流式传输到 Unity3D

假设我有一个无线摄像机我想将其实时流式传输到统一有办法实现这一点吗奖励问题广角相机怎么样 180 甚至 360 如果这是我想要与之交互的镜头那么延迟会是一个多大的问题除了常规镜头之外还可以发送更多数据例如深度感知使用深度感
从范围中选择但排除某些数字[重复]

这个问题在这里已经有答案了是否可以从给定范围 1 90 中选择一个随机数但排除某些数字排除的数字是动态创建的假设它们是 3 8 和 80 我已经设法创建随机数生成器但无法识别任何可以满足我的要求的函数 Random r new R
C#支持多重继承吗？

我和一位同事就多重继承发生了一些争论我说不支持他说支持所以我想还是去问问网上那些有头脑的人吧抱歉您不能从多个类继承您可以使用接口或一个类和接口的组合其中接口应遵循签名中的类名称 interface A interface B
“ls”命令在 Linux/Unix 中如何工作？

我想确切地知道 Is 命令在 Linux 和 Unix 中是如何工作的据我所知 ls forks exec 到 Linux Unix shell 然后获取输出当前文件树的输出例如 home ankit 我需要更详细的解释因为我不确定
如何使用 Array.sort 按特定元素对结构数组进行排序

很简单我有一个这样的结构 struct bla string name float depth 我有一个 bla 数组我想按深度排序最大深度优先代表应该做什么返回我找不到任何具体的例子你可以在这里找到一个例子我将如何对结构数
获取布尔数组中至少 n 个连续 False 值的第一个块的索引

我有一个numpy布尔数组 w np array True False True True False False False 我想获得第一次的索引n at least错误的值例如这里 n at least 1 gt desired in
如何检查对象和嵌套字段是否为空[重复]

这个问题在这里已经有答案了我有一个对象我想检查该对象或嵌套字段是否为空我想打印这个网络字段但我应该检查某个级别是否有空否则我会得到空指针异常我知道我可以这样做 if object null object A null objec
具有两个参数的路由的未定义 [controller]_path

我在 Phoenix 应用程序中创建了一个控制器名为ProgressController 这就是我的路由器文件的样子 defmodule MyTestApp Router do use MyTestApp Web router pipel
比较函子类型与运算符<

In the 谷歌 C 风格指南 the 关于运算符重载的部分建议不要超载any运算符除非在罕见的特殊情况下具体来说它建议特别是不要超载operator or operator lt 只是这样您的课程可以用作 STL容器相反你
如何告诉 iOS 从 iCloud Drive 下载文件并获取进度反馈

我正在使用 UIDocumentPicker 选择一个文件但如果文件很大则可能需要一段时间才能打开这对于用户来说并不是一个特别好的体验我看过 Apple 的 iCloud 编程指南我似乎无法弄清楚如何实际下载文件并获得一些进度反馈
在 Moment 阿拉伯语本地化中自定义数值

我想在 moment js 中创建自己的语言环境其父级应该是阿拉伯本地语言但我只想更改为数字格式来显示0 9 不是默认显示根据文档我可以从以下开始 moment defineLocale ar sa mine parentLocal
使用 python-docx 从 .docx 文件中提取图像位置

我正在尝试使用以下命令从 docx 文件中获取图像索引python docx图书馆我能够提取图像的名称图像的高度和宽度但不是它在word文件中的索引 import docx doc docx Document filename for

使用 python-docx 从 .docx 文件中提取图像位置

使用 python-docx 从 .docx 文件中提取图像位置 的相关文章

随机推荐

热门标签

使用 python-docx 从 .docx 文件中提取图像位置的相关文章