如何自定义 Plone 搜索引擎以激活 excel 文件的全文索引?我已经安装了 pdftotext 和 wv 用于 pdf、word 文件全文索引。
如果你添加产品.OpenXml https://pypi.python.org/pypi/Products.OpenXml添加到您的实例 Egg 并将其安装在 Plone 中,您可以索引现代 Office 格式,至少是 .docx 和 .xlsx。对于普通的旧 Excel (.xls) 文件,这不起作用。
几周前我在 Plone 4.3.2 构建配置中尝试过:
[instance]
eggs =
...
Products.OpenXml
[versions]
# You need a more recent lxml than default Plone, some 3.x version
lxml = 3.3.3
Products.OpenXml = 1.1.1
或者或另外,使用产品.AROfficeTransforms https://pypi.python.org/pypi/Products.AROfficeTransforms。我只尝试将其与 Products.OpenXml 结合使用,但如果您只对旧式 Excel 工作表 .xls 感兴趣,那么 Products.AROfficeTransforms 本身就足够了。在构建配置中:
[instance]
eggs =
...
Products.AROfficeTransforms
[versions]
Products.AROfficeTransforms = 0.11.0
它需要在您的系统上安装 xlhtml 二进制文件。这是一个古老的二进制文件,最后一次更改是在 2002 年。我没有尝试自己安装它。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)