Python Tesseract 无法识别这种字体

2024-04-04

我有这个图像:

我想使用 python 将其读取为字符串,我认为这并不难。我发现了 tesseract,然后是使用 tesseract 的 python 脚本的包装器。

所以我开始阅读图像,效果很好,直到我尝试阅读这张图像。我是否需要训练它来读取特定的字体?关于特定字体是什么有什么想法吗?或者是否有更好的 ocr 引擎我可以与 python 一起使用来完成这项工作。

编辑:也许我可以围绕数字制作某种矢量,然后以更大的尺寸重新绘制它们?图像越大,tesseract ocr 似乎读取它们的效果就越好(毫不奇怪,哈哈)。


只需针对 10 位数字和“.”训练引擎即可。应该可以做到这一点。并确保在 OCR 之前将图像更改为灰度。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python Tesseract 无法识别这种字体 的相关文章