所以我想知道是否有一种方法可以在javascript中从pdf中提取文本?我已经调查了一些 npm 模块,例如 PDF-TO-TEXT,但它们都接受文件路径名作为输入。我正在使用react-drop-to-upload模块来允许用户将pdf拖放到react组件中。 React 组件接收 pdf 文件并返回 File 对象而不是文件路径。有没有办法将存储在 File 对象中的 PDF 转换为文本?谢谢!
PDF.js https://mozilla.github.io/pdf.js/允许您加载文件对象,然后将文档解析为文本。这example https://mozilla.github.io/pdf.js/examples/#hello-world-using-base64-encoded-pdf从官方网站来看正是这样做的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)