计算pdf中(Td,TD,Tm,cm,T*)内容流的确切位置?

2024-02-12

获取或计算 pdf 中(Td、TD、Tm、cm、T*)内容流的确切位置?

作为一个人,我能够通过比较字形在pdf和内容流位置值中的位置来计算(无论是替换最后一个Td还是添加到最后一个Td或与fontsize相乘)pdf内容流中标签的位置。但我无法以编程方式计算字形的完美位置。请看屏幕短。

在上图中,左侧框是 pdf ui 字形,右侧框包含相关内容流。在内容流中,我突出显示了两个 Td 位置。

在第一个圈子里

3.321 -6.475999832 TD

Td 头寸应添加到最后的 Td 头寸中。假设x1,y1。

Current_x_pos = x1+3.321

当前_y_位置 = y1-6.475999832

然后我们就可以得到字形“t”的确切位置。

在第二个突出显示的圆圈中,新的 Td 位置 (231.544 366.377990 Td) 被完全替换,如下所示

当前_x_位置 = 231.544

当前_y_位置 = 366.377990

除此之外,有时父标签是 Tm 在这种情况下,公式可能是这样的

Current_x_pos = x1+(tdx1*font_size)

Current_y_pos = y1+(tdy1*font_size)

当我们需要像上面那样进行乘法时,有时还需要加法。以编程方式我怎么能知道这一点。解析准确的位置?(为乘法添加了新的屏幕简短内容)

Any help ? Thanks. enter image description here enter image description here


当我们需要像上面那样进行乘法时,有时还需要加法。以编程方式我怎么能知道这一点。解析准确的位置?

这很简单,对于一个Td操作你always相乘,请参阅 ISO 32000-1 规范(ISO 32000-2 中类似):

For a freshly initialized (i.e. identity) text line matrix Tlm this matrix multiplication looks like replacing its bottom row with tx ty 1.

For a text line matrix Tlm with only changes in the bottom row against an identity this matrix multiplication looks like an addition to the bottom row, e.g. x y 1 becomes x+tx y+ty 1.

For a text line matrix Tlm like in your second example

a 0 0
0 a 0
x y 1

this matrix multiplication looks like a multiplication with a followed by an addition to the bottom row, i.e. x y 1 becomes x+a·tx y+a·ty 1. If the font size parameter of the preceding Tf operation was 1, then a would effectively be the resultant font size giving rise to your assumption the font size is part of the formula.

In general, for an arbitrary, non-degenerate text line matrix Tlm

a b 0
c d 0
x y 1

this matrix multiplication looks even more complex, x y 1 becomes x+a·tx+c·ty y+b·tx+d·ty 1.

因此,关于你的问题

以编程方式我怎么能知道这一点。解析准确的位置?

你的程序应该只是总是使用矩阵乘法并忽略它在单独坐标层面上的样子。


使第二个圆圈指令看起来只是替换的原因是先前的文本行矩阵是单位矩阵。但这并不是由于 François 假设的恢复状态操作,而是更简单地由于文本对象操作的开始BT:

由于文本矩阵和文本行矩阵在文本对象开始时被重置,并且图形状态无法在文本对象中保存或恢复,因此在这种情况下不能归咎于保存和恢复图形状态操作。

(屏幕截图来自 Adob​​e 共享的 ISO 32000-1 副本。)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算pdf中(Td,TD,Tm,cm,T*)内容流的确切位置? 的相关文章

  • 如何让TalkBack自动读取TextView错误信息?

    我目前正在使我的应用程序可访问 但我的 EditTexts 遇到问题 在每个 EditText 中 用户的输入都会在某个时刻 例如按下按钮后 进行验证 如果输入无效 我会使用以下命令显示错误editText setError message
  • Android - 使用 Intent 打开 PDF 文档关闭后不保存

    我面临的问题是 当尝试保存对使用此 URI 打开的 PDF 文档的更改时内容 xx xxx xxx fileprovider external Download Sync FileName pdf 我所做的任何更改在关闭文档后都不会保存 但
  • 使用 javascript 在 IFrame 中打印 PDF 文件仅获取一页

    这是我打印 pdf 文件的代码 在这里 在打印时我只得到一页 我需要一个解决方案 function printPdf var ifr document getElementById frame1 PDF is completely load
  • 如何在 iOS 上反转使用 CoreGraphics 渲染的 pdf 上的文本颜色?

    我正在使用开源 PDF 查看库 VFR PDF Readerhttps github com vfr Reader https github com vfr Reader 我正在尝试实现 夜间模式 或黑色背景与白色文本 我可以将背景设置为我
  • Python - 将 XLSX 转换为 PDF

    我一直用win32com我的开发服务器中的模块可以轻松转换xlsx to pdf o win32com client Dispatch Excel Application o Visible False o DisplayAlerts Fa
  • 从 PDF 中提取不可选择的内容

    我正在使用 Apache PDFBox 从 PDF 文件中提取页面 但找不到提取不可选择的内容 文本或图像 的方法 从 PDF 文件中选择内容是没有问题的 请注意 相关 PDF 在复制内容方面没有任何限制 至少从我在文件的 文档限制摘要 中
  • 如何打开PDF并阅读?

    我如何打开 PDF 文件并使用 Python 读取其中的一些内容 这种语言是首选 但是 Ruby Perl 或 PHP 也可以 以防它被识别 不仅仅是图像 或报告说如果没有它就不可能光学字符识别 TIA 更新 感谢您的解决方案 我确信其中一
  • R 在设置宽度和高度的 PDF 中缩放绘图元素

    尽管发送到 PDF 的 R 图可以在插图或页面布局软件中随意重新缩放 但科学期刊通常坚持提供的图具有特定的尺寸 是否可以直接在 R 中在给定 PDF 大小内缩放所有绘图元素的大小 require ggplot2 p lt qplot dat
  • 屏幕阅读器是否在 SPAN 上暂停

    如果出于演示目的需要将一个单词与spans 或其他内联元素 屏幕阅读器是否仍会读取整个单词 Example code span code s or Forscher span class gendered In span 通常 屏幕阅读器在
  • 从 PDF 转换为 HTML [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • ABCPdf 添加文档 javascript

    是否可以使用 ABCPdf 将文档 JavaScript 添加到生成的 PDF 中 如果你的意思是 在文档加载后执行的Javascript 那么看看本文档页面 http www websupergoo com helppdf8net sou
  • Apache PDFBox:将最后一页移动到首页

    我正在使用 Apache PDFBox 编写一个简单的 Java 应用程序 我有几个 PDF 其中最后一页是前几页内容的索引 我需要索引 最后一页 成为PDF文件的第一页 是否可以 我还发现了http itextpdf com http i
  • JsPdf 库无法读取 PDF 中的阿拉伯语

    在 pdf 中显示阿拉伯值的代码不起作用 它向我展示了一些我无法理解的奇怪语言 var sm nature name nature1 ar 1 name nature2 ar 2 name nature3 ar 3 name nature4
  • TCPDF UTF-8 符号未显示

    我使用最新的 TCPDF 版本 5 9 但在编码方面遇到一些奇怪的问题 我需要立陶宛语语言符号 例如 但只能得到其中的一小部分 其他的还是这样 所以我该怎么做 我使用默认的 times 字体 它带有 TCPDF 下载 任何帮助 将不胜感激
  • 如何使用间隙分隔pdf中的段落?

    我有一些 pdf 文件 每页有 2 3 个段落 每个段落都由一些行间隙分隔 但是在使用 pymupdf 阅读时 我看不到段落之间有任何机器可打印的分隔符 还有其他方法吗 其他图书馆可以做到这一点吗 code import fitz from
  • 将 SignedHash 插入 PDF 中以进行外部签名过程 -workingSample

    遵循电子书第 4 3 3 节 PDF 文档的数字签名 https jira nuxeo com secure attachment 49931 digitalsignatures20130304 pdf 我正在尝试创建一个工作示例 其中 客
  • 虚拟乐器 iPhone 应用程序中的 VoiceOver 辅助功能?

    我收到盲人用户的评论 称我的一些声音和音乐相关应用程序只能在关闭 VoiceOver 的情况下使用 在 iOS 设备上启用 VoiceOver 辅助功能后 是否可以启用音乐键盘或鼓垫触摸区域 以便在点击键盘键或虚拟鼓组 等 时可以立即播放音
  • 文本挖掘 pdf 文件/词频问题

    我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到 当我挖掘一些 pdf 文档时 我得到的高频词是 phi taeoe toe sigma gamma 等 它与某些 pdf 文档配合良好 但与其他文档配合使用时却得到这
  • DOCX 到 PDF:SaveAs2、ExportAsFixedFormat 与 PrintOut

    我有一个小小的目标 即使用 C 和 NET 将大量 docx 文件转换为 pdf 而无需打开 Word 可见 且无需使用任何第三方库 需要管理的组件更少 花费的资金也更少 目前 我正在尝试正确转换单个文档 该文档必须尽可能高效 以便快速转换
  • 使用 Django 从标准输出返回 pdf 响应

    我正在使用 wkhtmltopdf 创建 PDF 文件 但是我不知道如何正确返回它们 所以我必须将它们写入我的媒体文件夹 然后重定向到刚刚创建的文件 编辑 Ian 的建议是写入 STDOUT 因此我更改了 wkhtmltopdf 命令来执行

随机推荐

  • 如何获取所有本地存储的用户配置文件的用户名和域?

    如何检索计算机上存储的所有用户配置文件的用户名和域 这是用户配置文件管理器的屏幕截图来说明我的意思 配置文件由 SID 映射 该映射存储在以下注册表项中 HKLM SOFTWARE Microsoft Windows NT CurrentV
  • 使用简单 XML (org.simpleframework.xml) 序列化第三方类

    我决定使用简单的 XML 序列化 http simple sourceforge net 并被基本问题困住了 我正在尝试序列化java util UUID类实例作为这个小类中的最终字段 Root public class Identity
  • 如何通过 AWS SQS 触发 AWS Glue 作业

    我正在学习一个名为 AWS Cloudformation 的出色工具 但我很难找到资源来了解如何通过 SQS 触发 AWS Gluejob 我从以下网站了解到了 Glue Triggers here https docs aws amazo
  • 大括号内内容的正则表达式

    是否有正则表达式来匹配大括号内的内容 例如以下内容 d key a 1 2 3 我想要匹配 key a 1 2 3 and a 1 2 3 但不是 键 a 1 2 3 在经典正则表达式中 这是不可能的 DFA 无法解析嵌套对 有多种方法可以
  • 悬停时使用 XML 内容更新 DIV

    我想做的事情的概念相当简单 我有一个通过 XSLT 从 XML 文档加载的公司徽标网格 每个徽标都有自己独特的公司简介链接 我在页面上有一个单独的 div 本质上是一个 预览 框 我想做的是这样的 我将鼠标悬停在徽标上 它会将公司名称和简短
  • 宏如何根据传递给它的类型定义有效的全局名称?

    我相信标题是不言自明的 但这里有一个例子来说明我想要实现的目标 define PASTE2 0 1 0 1 define DEFINE OPS FOR TYPE TYPE int PASTE2 do something with TYPE
  • MySQL对键值对作为记录过滤的优化

    我有一个数据库结构 旨在以易于扩展的方式存储特定对象的属性 有一个 对象 表 id name type etc 接下来 我有一个 属性 表 id Name 最后 关系 表 用于将所有数据保存为具有相应值的属性 对象对 作为主键 id obj
  • 是否可以使用 Spotify Web API 编写没有回调 URI 的桌面应用程序?

    我想编写一个简单的供个人使用的桌面应用程序 它使用 Spotify Web API 来构建播放列表 然而 据我所知 如果不提供回调 URI 就无法使用 API 而我没有回调 URI 因为我没有任何类型的域或服务器 除了我的个人计算机 有没有
  • 如何将 uint32 转换为字符串?

    我需要转换一个uint32 to string 我怎样才能做到这一点 strconv Itoa似乎不起作用 很长的故事 我需要将通过 imap 包接收到的 UID 转换为string以便我稍后可以将其设置为序列 附带说明一下 我想知道为什么
  • 如何更改 UIDatePicker 的线条颜色

    我的一个 ViewController 中有一个 UIDatePicker 如您所见 背景很暗 我已经设法将文本颜色更改为白色 我无法更改的是所选日期上方和下方两行的颜色 它始终保持默认的深灰色 有没有人有一段代码来实现对这些线条进行着色
  • htaccess 重定向不适用于带参数的 URL

    我想将index php action this id 1重定向到index php action this id 2 我在 htaccess 中尝试了下面的代码 但没有帮助 redirect 301 index php action th
  • 将 Enum 成员序列化为 JSON

    如何序列化 PythonEnum成员到 JSON 以便我可以将生成的 JSON 反序列化回 Python 对象 例如 这段代码 from enum import Enum import json class Status Enum succ
  • 如何通过键盘添加 UIView - iOS

    我一直在尝试在 iOS 上显示 toast 消息 我所做的是 当任何通知到来时 我只需获取导航控制器视图并为我的 toast 消息添加一个子视图并显示即可 UIView top view self navigationController
  • 必须避免奇怪的站点访问者用户代理吗?如果是的话怎么办?

    我正在使用共享主机 我的网站显示 ERR CONNECTION REFUSED 所以我去拜访我的 SSL 网站的访客 我发现 用户代理 列表中没有常规名称 cpanel 访客列表显示 用户代理 Expanse 对我们客户的网络边界进行索引
  • C#/Unity - 将 StreamWriter.WriteLine 转换为 StreamWriter.Write 并将消息字节大小作为前缀

    我一直在研究并得出结论 使用StreamWriter WriteLine这不是最好的主意 然而 使用StreamWriter Write并添加实际消息字节大小的前缀并将其从客户端发送到服务器 以便服务器知道从哪里开始读取以及从哪里停止读取
  • 在 DotNet RGB24 或 RGB32 中使用哪个更好地提高性能

    我在我的应用程序中使用了大量图像 也用于动画 因为 3 兆像素图像 2048 1536 3 145 728 保存大约 9MB 的数据 每个像素 R G B 所以我曾经认为它比 32BIT 12MB 每个像素 A R G B 但显卡的架构似乎
  • Scala 蛋糕模式和依赖冲突

    我正在尝试使用 Cake 模式在 Scala 中实现依赖项注入 但遇到了依赖项冲突 由于我找不到具有此类依赖项的详细示例 因此这是我的问题 假设我们有以下特征 有 2 个实现 trait HttpClient def get url Str
  • PHP 使用 DatePeriod 创建带有休息时间的时间段

    我想创建带有开始时间 结束时间和休息时间的时间段 public function getServiceScheduleSlots duration break stTime enTime start new DateTime stTime
  • 如何在Python中加入列表但使最后一个分隔符不同?

    如果只有两个项目 或者最后两个项目之间有逗号和一个 符号 我试图将列表转换为与 符号连接的分隔字符串 例如 Jones Ben Jim Jack James 我目前有这个 pa join listauthors search 并且不知道如何
  • 计算pdf中(Td,TD,Tm,cm,T*)内容流的确切位置?

    获取或计算 pdf 中 Td TD Tm cm T 内容流的确切位置 作为一个人 我能够通过比较字形在pdf和内容流位置值中的位置来计算 无论是替换最后一个Td还是添加到最后一个Td或与fontsize相乘 pdf内容流中标签的位置 但我无