我有一个阿拉伯语 PDF,我想使用 Java 将其解析为文本文档。我已经尝试了很多次,英语单词解析成功,但阿拉伯语单词解析失败。
谁能推荐一个可以正确转换阿拉伯语单词的解决方案?
我想到了几个图书馆。阿帕奇蒂卡 http://tika.apache.org/, iText http://itextpdf.com/ or pdfbox http://pdfbox.apache.org/都会或多或少地解决你的问题。不过,我必须对 Tika 说几句话,因为它支持语言检测,并且还可以处理其他文档类型。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)