使用命令行开关将 PDF 另存为文本 - 可以做到吗?

2024-01-06

我需要使用命令行开关来执行“另存为文本”命令。理想情况下,我想要:

  1. 使用命令行开关打开 PDF
  2. 使用命令行开关通过模仿“另存为文本”命令将 PDF 转换为文本文件。
  3. 使用命令行关闭 PDF。

这可能吗?如果是这样,那么有人知道该怎么做吗?


也许你可以尝试这个:https://github.com/luochen1990/nodejs-easy-pdf-parser https://github.com/luochen1990/nodejs-easy-pdf-parser

它是一个 npm 包,您需要安装 nodejs (和 npm)才能使用它。

它可以用作命令行工具:

npm install -g easy-pdf-parser
pdf2text test.pdf > test.txt

该工具将按 y 坐标对文本行进行排序,因此在大多数情况下效果很好。而且它还可以很好地与 unicode 和跨平台配合使用。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用命令行开关将 PDF 另存为文本 - 可以做到吗? 的相关文章

  • 在新窗口中打开 SAS 程序

    目前 当您在 Windows 中双击 SAS 文件时 它将在您已打开的现有 SAS 会话中打开它 有没有办法让它在窗口中单击时会启动一个新的 SAS 窗口 据我所知 SAS 是一个所谓的 单实例 应用程序 因此它的默认行为是在现有会话中打开
  • 在 Windows 11 上无需管理员权限即可运行 Visual Studio 2022

    我在 Windows 11 上安装了 Visual Studio 2022 当我启动它时 它始终以管理员权限运行 我想在没有管理员权限的情况下运行它 我的 Windows 只有一个帐户 该帐户具有管理员权限 x 我做了什么 确认VS2022
  • 在 Jenkins 中执行批处理文件

    我有一个简单的批处理文件 我想要从 Jenkins 调用 运行 执行该文件 Jenkins 中有同样的插件吗 如何从 Jenkins 执行批处理文件 如果有相同的教程或文档 无需为此添加新插件 在Jenkins 选择您的工作名称并转到配置部
  • 为什么 cygwin 无法读取我的主目录中的 .ssh/config 文件?

    我正在使用 cygwin 并且正在尝试设置 ssh config 文件 Cygwin 的文件夹位于我的 C 驱动器中 我的主目录是 C Users USER 我注意到 当我编辑 C Users USER ssh config 时 cygwi
  • Python 无法在 git bash 命令行中工作

    Python 不会在 git bash Windows 中运行 当我在命令行中输入 python 时 它会将我带到一个空行 而不会像在 Powershell 中一样显示它已输入 python 2 7 10 它没有给我错误消息 但 pytho
  • 如何在 C++ 中急于提交分配的内存?

    总体情况 带宽 CPU 使用率和 GPU 使用率都极其密集的应用程序需要每秒从一个 GPU 向另一个 GPU 传输约 10 15GB 的数据 它使用 DX11 API 来访问 GPU 因此上传到 GPU 只能在每次上传都需要映射的缓冲区中进
  • Windows 上的 Openssl 错误 0x02001005 和 0x2006D002?

    我正在尝试使用 openssl 将 cer 证书转换为 p12 证书 这是我正在使用的命令 C OpenSSL Win32 bin gt openssl x509 inform der in developer identity cer o
  • 更改 mingw' 启动目录或创建 mingw 符号链接

    设置 mingw 控制台启动目录的最简单方法是什么 我只使用 mingw 进行编译 但由于缺乏编辑器甚至符号链接 我很困惑如何告诉 mingw 控制台出现在不同的目录而不是常规的主目录中 如果有人知道如何像 cygwin 那样将 真正的 符
  • 确定用于映射网络驱动器的域和用户名

    使用带有 SP1 的 Windows 7 Enterprise 但我希望得到适用于 Windows XP 2003 2008 Vista 7 的通用答案 从命令提示符处 我执行net use命令将 Z 驱动器映射到另一台计算机上的共享 但我
  • 检测计算机何时解锁 Windows

    我用过这个优秀的方法 https stackoverflow com questions 20733441 lock windows workstation using python 20733443锁定 Windows 计算机 那部分工作
  • Qt(在 Windows 上)将权限级别设置为“requireAdministrator”

    我正在使用 Qt Creator 并努力制作 exe文件默认以管理员身份运行 在线阅读所有解决方案我试图将这一行放入我的 pro file QMAKE LFLAGS MANIFESTUAC level requireAdministrato
  • 如何在RobotFramework中进行多行测试设置或拆卸而不创建新关键字?

    我需要在测试用例中调用两个拆卸关键字 但不能为此创建新关键字 我很有趣 如果有这样的关键字语法 例如文档或循环 Documentation line1 line2 line3 使用 运行关键词 http robotframework org
  • Kerberos 双跳

    我们遇到了臭名昭著的 Kerberos 双跳问题 这是一个全新的域 是从以前使用模拟和委派的另一个提供商迁移而来的 我们已将操作系统升级到最新的 SQL 服务器 2017 WPF 应用程序 使用域凭据 gt Web 服务 IIS 10 上的
  • 访问图像的 Windows“标签”元数据字段

    我正在尝试进行一些图像处理 所以现在我正在尝试读取图像 exif 数据 有 2 个内置函数可用于读取图像的 exif 数据 问题是我想读取图像标签 exifread and imfinfo这两个函数都不显示图像标签 Is there any
  • 将 SignedHash 插入 PDF 中以进行外部签名过程 -workingSample

    遵循电子书第 4 3 3 节 PDF 文档的数字签名 https jira nuxeo com secure attachment 49931 digitalsignatures20130304 pdf 我正在尝试创建一个工作示例 其中 客
  • Qt 支持 Windows 蓝牙 API 吗?

    谁能告诉我 Qt 是否支持 Windows 蓝牙 API 如果是这样 您能否分享一些有关如何使用它的信息 自上次答复以来 这个问题的答案发生了一些变化 Qt 5 2 版为 Linux BlueZ 和 BlackBerry 设备实现了蓝牙 A
  • Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

    我正在尝试做的事情 我正在尝试使用 pywinauto 在 python 中创建一个脚本 以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例 因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
  • 相当于Linux中的导入库

    在 Windows C 中 当您想要链接 DLL 时 您必须提供导入库 但是在 GNU 构建系统中 当您想要链接 so 文件 相当于 dll 时 您就不需要链接 为什么是这样 是否有等效的 Windows 导入库 注意 我不会谈论在 Win
  • 如何将 GIT 调用的输出获取到批处理脚本中的变量中?

    我有一个 git 命令来获取当前存储库的最新 SHA 如下所示 git log pretty format H n 1 我有一个 Windows 批处理脚本 我想按如下方式使用它 SET CURRENT SHA 但我不知道如何将从 git
  • 如何从Windows阻止社交媒体[关闭]

    Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案 我想根据时间阻止我的电脑上的社交媒体 晚上 9 点后屏蔽 上午 11 点后解锁 如家长控制 我尝试过关注但失败了 创建了

随机推荐

  • 如何在Python中将元组的元组转换为pandas.DataFrame?

    如果问题太基本 也没有冒犯的意思 如果您需要更多信息 请与我们联系 我正在寻找一种想法 以干净 高效 Pythonic 的方式将方形元组转换为 pandas DataFrame 即来自 s 1 0 0 0 2 3 0 0 4 5 6 0 7
  • 在 Hibernate 中使用 Spring Data 查询时出现 NoViableAltException

    我正在使用指定 Spring Data 查询 Query在存储库方法上 但它抛出了NoViableAltException例外 这是我正在使用的存储库接口方法和注释 Query value SELECT one saveLine two s
  • 对 Julia 中的内存分配和垃圾收集感到困惑

    我对 Julia 中的内存分配有点困惑 我从常见问题解答中知道 http julia readthedocs org en latest manual faq 清除大变量使用的内存是通过将其设置为较小的值 例如 0 然后运行来完成的gc 但
  • Mac OS X 上带有 Cocoa WebView 的综合 Web 服务器

    我想创建一个 Webview 我可以完全控制它加载的内容 本质上 我想提供一个类的实例 它扮演 URL 中指定的各种 Web 服务器的角色 理想情况下 我会为这个 webview 提供一个委托 它会告诉委托它需要的每个 URL 并且委托将使
  • 卓:0.0.0.0/0 和 ::/0 是什么意思?

    在安全组中 我添加的每个入站端口都添加了两条规则 一条为 0 0 0 0 0 另一条为 0 它们分别是什么意思 Internet 协议版本 4 IPv4 中的默认路由被指定 作为 CIDR 表示法中的零地址 0 0 0 0 0 通常称为 四
  • Angular 反应式表单集和清除验证器

    请协助 我想删除表单中的所有验证器 请告知是否可能 如果不可能 如果您有一个包含 20 个或更多表单控件的表单组 删除验证器的更好方法是什么 请参阅下面的示例 ngOnInit this exampleFormGroup this form
  • ExoPlayer 2 的质量选择器

    我目前正在开发一个现场和电影播放器 应用程序 我选择了Exo播放器版本2播放这部电影 我对此了解不多 我想让用户选择电影的质量在播放器屏幕上 例如 720p 或 1080p 等 但我不知道如何获取现有品质的列表并将其显示给用户 下面的代码是
  • LightGBM错误:ValueError:为了提前停止,至少需要一个数据集和评估指标进行评估

    我正在尝试使用 gridsearch 训练 LightGBM 当我尝试训练模型时出现以下错误 ValueError For early stopping at least one dataset and eval metric is req
  • 有没有办法为记事本++、HTML 编码启用智能感知?

    有没有办法为notepad 启用智能感知 我听说最接近的是一个名为 Fingertext 的插件 但我不知道如何使用它 是的 NP v6 6 8 中有一个 默认情况下是禁用的 要启用它 请在菜单栏中导航至 Settings 优先 自动完成
  • chromecast 调试器可以工作,但不显示任何内容?

    我最近安装了 chrome cast 设备并在该设备上启用了调试器模式 将接收器应用程序发送给 google 并从他们那里获取应用程序 ID 将应用程序 ID 设置到我的发件人应用程序中 一切正常 但问题是我在调试器上看不到任何内容 也无法
  • PowerManager.newWakeLock() 抛出 IlleagelArgumentException

    然而 当我打电话时 我正在尝试获取唤醒锁PowerManager newWakeLock 我收到 IlleglArgumentException 这是我用来获取的代码 private void setWakeLock Context con
  • 如何让div中的文本始终位于中间?

    我试图让文本保留在可调整大小的 DIV 中间 这是例子 CSS rightmenu position absolute z index 999999 right 0 height 60 text align center HTML div
  • 如何从 iOS 设备的 iPod 库导出 mp3 文件?

    在我的 iOS 应用程序中 我试图导出mp3文件从 iPod 库复制到设备上应用程序的文档目录 目前我正在尝试使用AVAssetExportSession但它不适合mp3文件 它适用于m4a files 是否可以使用 AVAssetExpo
  • 独立实施和托管实施之间是否存在有意义的区别?

    我的问题主要与第四节第六段 http www iso 9899 info n1570 html 4 p6 合规实施的两种形式是托管式和独立式 合格的托管实施应接受任何严格合格的程序 据我了解 这构成了典型的应用程序环境 包括文件系统 分配的
  • 通过单击缩放按钮放大和缩小图像(Javascript)

    我正在尝试通过两个缩放按钮 和 放大和缩小图像 问题是当图像为全屏尺寸 宽度 100 时 放大 会停止 我需要将图像缩放到比屏幕尺寸大得多 只是不知道如何做到这一点 我是 Javascript 初学者 所以我希望有人有动力帮助我解决这个 J
  • 日期转换程序中的奇怪错误

    我无法修复代码中的奇怪错误 我编写了一个程序来打印最初以 MM DD YYYY 格式编写的日期 格式为 月 DD YYYY 该程序很简单 我将日期存储在char数组 然后用strtok我分别获取月 日 年并存储指向它们的指针 在一个char
  • 如何将 std::string 传递给需要 char* 的函数? [复制]

    这个问题在这里已经有答案了 可能的重复 我可以从 C 字符串中获取非常量 C 字符串吗 https stackoverflow com questions 1919626 can i get a non const c string bac
  • BASH 中多列文件的反向排序顺序

    我有以下文件 1 2 3 1 4 5 1 6 7 2 3 5 5 2 1 我希望文件按第二列排序 但从最大数字 在本例中为 6 到最小数字 我尝试过 sort 1 2 file dat 但它按升序排序 而不是降序 结果应该是 1 6 7 1
  • 命令是否从 shell 脚本中的当前目录运行?

    在 bash shell 脚本中我尝试了这两个版本 java jar abc jar and CMD java jar abc jar CMD 第一个版本可以工作 第二个版本则抱怨找不到 abc jar 为什么 命令确实从 shell 脚本
  • 使用命令行开关将 PDF 另存为文本 - 可以做到吗?

    我需要使用命令行开关来执行 另存为文本 命令 理想情况下 我想要 使用命令行开关打开 PDF 使用命令行开关通过模仿 另存为文本 命令将 PDF 转换为文本文件 使用命令行关闭 PDF 这可能吗 如果是这样 那么有人知道该怎么做吗 也许你可