有没有办法将 .ppt 文件转换为 .pptx 文件。
客观的:我需要从 .ppt 文件中的表中提取文本(列名称为姓名、地址、联系电话、电子邮件等)。为此,我遵循了这种方法:
我将 .ppt 文件转换为 pdf,然后使用 PDFminer 从 pdf 中提取数据。从 pdf 中提取的文本不使用任何分隔符分隔。因此,很难区分表中的名称和其他字段。
我正在研究的可能解决方案:
- 将 .ppt 文件转换为 .pptx
- 解析 .pptx 文件的 xml 以获取格式化文本
我陷入了将文件格式从 .ppt 转换为 .pptx 的第一步。
我找不到任何在 python 中将 .ppt 文件格式转换为 .pptx 格式的解决方案。
我创建了这段代码希望这对您有用:
import win32com.client
PptApp = win32com.client.Dispatch("Powerpoint.Application")
PptApp.Visible = True
PPtPresentation = PptApp.Presentations.Open(r'D:\ppt\sample.ppt')
PPtPresentation.SaveAs(r'D:\ppt\final.pptx', 24)
PPtPresentation.close()
PptApp.Quit()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)