在Python中将ppt文件转换为pptx

2024-01-03

有没有办法将 .ppt 文件转换为 .pptx 文件。

客观的:我需要从 .ppt 文件中的表中提取文本(列名称为姓名、地址、联系电话、电子邮件等)。为此,我遵循了这种方法:

我将 .ppt 文件转换为 pdf,然后使用 PDFminer 从 pdf 中提取数据。从 pdf 中提取的文本不使用任何分隔符分隔。因此,很难区分表中的名称和其他字段。

我正在研究的可能解决方案:

  1. 将 .ppt 文件转换为 .pptx
  2. 解析 .pptx 文件的 xml 以获取格式化文本

我陷入了将文件格式从 .ppt 转换为 .pptx 的第一步。 我找不到任何在 python 中将 .ppt 文件格式转换为 .pptx 格式的解决方案。


我创建了这段代码希望这对您有用:

    import win32com.client
    PptApp = win32com.client.Dispatch("Powerpoint.Application")
    PptApp.Visible = True
    PPtPresentation = PptApp.Presentations.Open(r'D:\ppt\sample.ppt')
    PPtPresentation.SaveAs(r'D:\ppt\final.pptx', 24)
    PPtPresentation.close()
    PptApp.Quit()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在Python中将ppt文件转换为pptx 的相关文章

随机推荐