我正在尝试从图片中提取一些范围从 1 到 99 的数字。我已经尝试了几种使用 PHP 的 OCR 方法,但最终我的脚本会失败,因为数字偶尔会向左或向右旋转 5%。这使得图片无法识别。
我现在已经安装了 Ocropushttp://code.google.com/p/ocropus/ http://code.google.com/p/ocropus/作为测试。不幸的是,这并没有每次都给我正确的数字。这让我觉得我的图片优化不够。
有人对如何优化数字的可读性有一些技巧/想法吗?我也将不胜感激如何从图片中找到数字的想法。
看起来 Tesseract / Ocropus 与倾斜混淆了,可能是同一行上的多个倾斜数字混淆了 Tesseract 或 Ocropus。
您是否将整个图像作为数字网格传递?您是否尝试过将每个框(数字)作为单独的图像单独发送到 OCR 引擎?您可能会发现您获得了更好的结果。
您是否尝试过其他 OCR 引擎?您需要它是开源的吗?
我通过更便宜的商业 OCR 引擎运行图像,所有数字都被正确识别。因此,另一种选择是使用 C# 或 C++ 代码和界面快速封装商业 OCR 引擎,以提供改进的结果。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)