我有很多 docx 文件需要转换为 pdf。将它们一一转换需要很长时间。所以我编写了一个 python 脚本来并行转换它们:
from subprocess import Popen
import time
import os
os.chdir(os.path.dirname(__file__))
output_dir = './outputs'
source_file_format = './docs/example_{}.docx'
po_list = [Popen(
f"/Applications/LibreOffice.app/Contents/MacOS/soffice --invisible --convert-to pdf --outdir {output_dir} {source_file_format.format(i)}",
shell=True)
for i in range(0, 7, 1)]
while po_list:
time.sleep(0.01)
for i, p in enumerate(po_list):
status = p.poll()
if status is None:
continue
elif status == 0:
print('Succeed: [{}] {} -> {}'.format(p.returncode, p.stderr, p.args))
po_list.remove(p)
else:
print('Failed: {} : {}'.format(p.args, p.poll()))
po_list.remove(p)
但每次运行此脚本时,只有部分 docx 文件转换成功。其余的转换过程甚至不会抛出任何错误信息。
我们也曾在同一个问题上陷入了一段时间。
LibreOffice 的多个实例使用 UserInstallation 目录共享相同的空间,因此并行转换在这里产生了问题(间歇性进程似乎混淆了)。
为每个 libre 实例使用不同的目录有助于解决此问题。您可以通过 UserInstallation env 变量来实现此目的,该变量可以传递为:“-env:UserInstallation=file:///d:/tmp/p0/”
您可以通过附加循环变量或目录中的任何唯一标识符来自动执行此操作。
参考:https://ask.libreoffice.org/en/question/42975/how-can-i-run-multiple-instances-of-sofficebin-at-a-time/ https://ask.libreoffice.org/en/question/42975/how-can-i-run-multiple-instances-of-sofficebin-at-a-time/
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)