基于多个 OCR 软件包输出来改进 OCR 结果的软件

2023-11-30

是否有现有的商业或学术软件可以

来自多个 OCR 软件包（Abbyy FineReader、Adobe Acrobat Professional、ReadIris 等）的叠加结果
根据从多个来源积累的知识提供完全自动化的改进
允许在运行时使用额外的外部工具设置（词典、批量网络/本地语料库查找等）

Note: I already have in-house solutions to visualize results from single sources, so in case there is no such software obtainable, I would not mind developing my own : ) Inquiries for cooperation would then also be most welcome!
_{(source: sourceforge.net)}

在多个 OCR 引擎之间使用投票的想法并不新鲜。问题是它并没有真正发挥作用。如果它们是本质上正交的简单分类器，那么您将结合他们的投票并改进结果，这可能会起作用。但它们都是非常复杂的软件，使用非常相似的一组众所周知的方法，几乎没有差异，但可能以不同的方式组合它们，有些实现更好，有些实现更差。

经验表明，当您结合多种 OCR 技术时，最佳决策规则是依赖最准确的一项技术的结果，而忽略其他技术。根据我的经验（我为 ABBYY 工作），ABBYY OCR 绝对是您提到的最准确的。

据我所知，使用投票的唯一原因是当您需要交叉检查“可疑”字符并将其发送到手动验证（如果要求 100% 准确度）时。使用这种方法可以增加要验证的字符数量，但会降低错过错误字符的可能性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Automation

OCR

基于多个 OCR 软件包输出来改进 OCR 结果的软件的相关文章

从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
使用 Tesseract OCR 和 python 进行数字识别

我使用 Tesseract 和 python 读取数字从能量计除了数字 1 之外一切都运行良好 Tesseract 无法读取 1 数字 This is the picture I send to tesseract tesseract
Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
如何像用户打字一样将输入发送到控制台？

这是我的问题我有一个程序必须在 TTY 中运行 cygwin 提供了这个 TTY 当我重定向 stdIn 时程序失败因为它没有 TTY 我无法修改该程序并且需要某种方法使其自动化如何抓取 cmd exe 窗口并向其发送数据并使其认
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE
InvalidArgumentException：消息：无效参数：“using”必须是字符串

我对 python 很陌生试图创建可重用的代码当我尝试通过传递 Login 类下使用的所有参数来调用 test main py 中的 Login 类和函数 login user 时我收到错误 InvalidArgumentExcept
自动安排并执行 PHP 脚本

我编写了一个 PHP 脚本它生成一个包含数据库中所有表的 SQL 文件我想要做的是每天或每 n 天执行这个脚本我读过有关 cron 作业的内容但我使用的是 Windows 如何在服务器上自动执行脚本您需要添加计划任务来调用 URL
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
(Tcl/Expect) 退出后清屏

我想在退出我的半交互式期望脚本后清除屏幕在本地计算机上我可以在脚本中做到这一点吗这是我尝试过的但失败了 usr bin expect f set env TERM vt100 spawn ssh Y username domai
如何从图像生成 tiff/box 文件以在 Windows 中训练 Tesseract

我正在尝试在 Windows 中训练 Tesseract 为此我需要一对 tiff box 文件并且我正在尝试使用 jTessBoxEditor 创建它但它不接受图像作为输入我也尝试过 boxFactory 但它无法正常运行有谁知道
如何在 Ubuntu/Linux 发行版中安装 Tesseract-OCR 3.03？

我和一个朋友有兴趣为 CV 项目训练 tesseract OCR 引擎我们尝试使用一些包装器例如 PyTesser 和 pyocr 但结果目前不如我们需要的那么准确因此我们希望尝试训练超立方体以更好地实现我们的目的即识别食品标签上
是否可以自动化 SQL Server 2008 分析器？

有一个post https stackoverflow com questions 488020 what is your most useful sql trick to avoid writing more code关于有用的 SQL
无法将 Tesseract OCR 模块添加到 Android Studio

我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
WatiN 还是 Selenium？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
从笔记本中提取文本

我正在尝试从图像中提取手写文本我使用 python 和 opencv 函数例如 find contours 当我使用像这样的图像时一切进展顺利它工作得很好因为我有一个简单的背景但后来我用这张图片测试了它由于背景中有笔记本的线条
去除 OCR 图像处理中的背景颜色

我正在尝试删除背景颜色以提高 OCR 对图像的准确性示例如下所示我会将所有字母保留在后处理图像中同时仅删除浅紫色纹理背景是否可以使用一些开源软件如Imagemagick将其转换为二值图像黑白来实现这一目标如果背景有不止一种
如何在存储过程中查找数据表列引用

我更改了 SQL Server 2005 数据库表中的列名称我还有一个相当大的存储过程集合它们可能引用也可能不引用该列有没有办法找到哪些存储过程引用该列而无需实际遍历每个存储过程并手动搜索它有没有办法自动查找哪些存储过程现在会中断
最好的 AutoHotKey 宏？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

随机推荐

jqGrid 多选对于大量本地数据非常慢，jQueryUI 1.8、jQueryUI 1.7 都很好

我在 ASP NET 页面中使用 jqGrid 并将数据注入到页面上的脚本块中然后从那里加载对于这一用例我们需要立即在屏幕上显示大量数据其中涉及 300 500 条记录每行 30 列对于这种情况分页不太合适用户需要能够扫描大
修复了带有单个 DOM 元素的响应式顶部导航/关闭画布导航

让我们先把小提琴排除在外建立在基础响应式框架 Fiddle 1 一个导航元素但当侧面导航滑出时变得不稳定 Fiddle 2 工作但使用多个导航元素好吧我一直在绞尽脑汁试图为以下问题开发优雅的解决方案 1 制作一个响应式固定的导航
停止龙卷风应用程序

让我们以 Tornado 主页中的 hello world 应用程序为例 import tornado ioloop import tornado web class MainHandler tornado web RequestHandl
用户窗体在“End Sub”后关闭，而无需调用“Unload Me”

我有一个用户表单 baseUF 它有多个页面和按钮它们都执行不同的操作我让这个 baseUF 是无模式的因为我希望用户能够在不关闭用户窗体并丢失他们输入的所有数据的情况下使用该工作表然而我开始遇到一个问题这可能是由于 baseU
64 位 COM dll 和 C#/.Net 应用程序之间的免注册互操作

我正在尝试在 64 位 COM dll 和 C 应用程序之间实现免注册 COM 互操作在我之前的一个问题的回答中我得到了帮助使我能够在 C 的 64 位 COM dll 上成功调用 HelloWorld 方法但是这只能通过使用 r
将大型复杂数组从 Python 传递到 C++ - 我的最佳选择是什么？

2017 06 13 编辑我尝试按照建议使用 boost 但是在花了超过 3 天的时间尝试编译和链接并失败后我决定愚蠢的痛苦方法可能是最快且不那么痛苦的方法所以现在我的代码只是保存了一堆巨大的文本文件跨文件分割数组和数字的复数虚部
EntityFramework：使用视图来扩展表

我想使用视图将信息添加到这样的表中 public class PocoTable public int Id get set public partial class ImportStatingRecordError Migration p
像整个链接一样在和下划线

我试图用一行下划线 a 和 span 我希望这一切都是带有下划线的链接它在单词和跨度之间留下了一个小空格但它不应该这样 a href Saber mais span class glyphicon glyphicon menu righ
PHP 命令行：max_execution_time 和 memory_limit

快问如果我从命令行运行 php 脚本通过 cron 作业 php somwthing sync php 我是否仍然受到 php max execution time 和 memory limit 的限制 Thanks Nathan 如果
Spark Kafka 流媒体问题

我正在使用maven 我添加了以下依赖项
如何将两个 jquery 对象包装成一个？

我有两个功能 1 function foo elems elems each function foo selector1 selector2 calling foo 2 function bar elem1 elem2 some logi
C# WinForms - 如何将更新从 DataGridView 发送到数据库

我有一个包含客户表和代理表的 mdb 文件代理表迄今为止所做的唯一一件事就是填充每个客户的代理下拉列表我有一个链接到 customerBindingSource 的 DataGridView customerBindingSource
使用 firebase 隐藏第 3 方 API 密钥

我正在使用 firebase 构建一个网站这是一个简单的查找服务只有一个输入元素可以向第 3 方 API 发出请求 www 3rdparty com api myapikey method 问题是我每秒只能发出 x 个请求并且无法向
PHP 5.2 中的 PHP date_parse_from_format() 替代方案

由于 date parse from format 仅在 PHP 5 3 中可用因此我需要编写一个函数来模仿其在 PHP 5 2 中的行为是否可以为 PHP 5 2 编写此函数并使其以与 PHP 5 3 中完全相同的方式工作 Examp
将函数参数重新声明为变量？

我似乎无法在网络上的任何地方找到这个问题的答案将函数参数重新声明为局部变量有什么原因优点或缺点吗 Example function param1 param2 var param1 param2 etc 对我来说似乎非常多余但也许我错
xmlpullparser 的 Android dalvik 转换

我正在开发一个 Android 应用程序对于一个组件我可以在 Android 之外进行测试因为它不使用任何 Android 代码它使用 xstream 我有以下库 xstream1 4 6 xpp3 min 1 1 4c xmlpu
在运行时动态加载程序集依赖项时出现问题

让我尝试解释一下我的问题我目前正在尝试开发一个用 Net编写的小型插件框架主要是为了进行一些实验因此我们的想法是拥有一个主应用程序可以通过在主应用程序的特定文件夹插件中部署 dll 来添加插件一切工作正常插件已正确实例
具有相同 id 的多个组件在 android 中如何工作？

我定义了几种布局其中很少有 id 被多重定义我很困惑它是如何工作的为什么它不像我们在java代码中那样给出错误最重要的是环境如何决定需要调用哪个组件我知道 id 生成的过程是自动化的它被添加到 R java 中例如如果我们
如何使用云函数触发数据流？（Python SDK）

我有一个由云发布订阅触发的云函数我想要使用 Python SDK 相同的函数触发数据流这是我的代码 import base64 def hello pubsub event context if data in event mess
基于多个 OCR 软件包输出来改进 OCR 结果的软件

是否有现有的商业或学术软件可以来自多个 OCR 软件包 Abbyy FineReader Adobe Acrobat Professional ReadIris 等的叠加结果根据从多个来源积累的知识提供完全自动化的改进允许在运行时使

基于多个 OCR 软件包输出来改进 OCR 结果的软件

基于多个 OCR 软件包输出来改进 OCR 结果的软件 的相关文章

随机推荐

热门标签

基于多个 OCR 软件包输出来改进 OCR 结果的软件的相关文章