基于多个 OCR 软件包输出来改进 OCR 结果的软件

2023-11-30

是否有现有的商业或学术软件可以

  • 来自多个 OCR 软件包(Abbyy FineReader、Adobe Acrobat Professional、ReadIris 等)的叠加结果
  • 根据从多个来源积累的知识提供完全自动化的改进
  • 允许在运行时使用额外的外部工具设置(词典、批量网络/本地语料库查找等)

?

Note: I already have in-house solutions to visualize results from single sources, so in case there is no such software obtainable, I would not mind developing my own : ) Inquiries for cooperation would then also be most welcome! screnshot
(source: sourceforge.net)


在多个 OCR 引擎之间使用投票的想法并不新鲜。问题是它并没有真正发挥作用。如果它们是本质上正交的简单分类器,那么您将结合他们的投票并改进结果,这可能会起作用。但它们都是非常复杂的软件,使用非常相似的一组众所周知的方法,几乎​​没有差异,但可能以不同的方式组合它们,有些实现更好,有些实现更差。

经验表明,当您结合多种 OCR 技术时,最佳决策规则是依赖最准确的一项技术的结果,而忽略其他技术。根据我的经验(我为 ABBYY 工作),ABBYY OCR 绝对是您提到的最准确的。

据我所知,使用投票的唯一原因是当您需要交叉检查“可疑”字符并将其发送到手动验证(如果要求 100% 准确度)时。使用这种方法可以增加要验证的字符数量,但会降低错过错误字符的可能性。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于多个 OCR 软件包输出来改进 OCR 结果的软件 的相关文章

  • 从图像中识别数字

    我正在尝试编写一个应用程序来查找图像内的数字并将它们相加 如何识别图像中的书写数字 图像中有很多框 我需要获取左侧的数字并将它们相加得出总数 我怎样才能实现这个目标 编辑 我对图像进行了 java tesseract ocr 但没有得到任何
  • 使用 Tesseract OCR 和 python 进行数字识别

    我使用 Tesseract 和 python 读取数字 从能量计 除了数字 1 之外 一切都运行良好 Tesseract 无法读取 1 数字 This is the picture I send to tesseract tesseract
  • Tesseract OCR 将削减的 0 混淆为 8

    我已经在终点字体上训练了 tesseract 但无论如何 我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框 即使在验证时 它也会将所有 0 读取为 8 我有什么遗漏的吗 下面是 0 的示例 它将其读作 8 我
  • 如何像用户打字一样将输入发送到控制台?

    这是我的问题 我有一个程序必须在 TTY 中运行 cygwin 提供了这个 TTY 当我重定向 stdIn 时 程序失败 因为它没有 TTY 我无法修改该程序 并且需要某种方法使其自动化 如何抓取 cmd exe 窗口并向其发送数据并使其认
  • 收据褪色部分可以恢复吗?

    我有一些包含一些扫描收据的文件 我需要使用 OCR 从中提取文本 由于收据上打印的文字在一段时间后会褪色 导致收据上的某些文字不清晰 影响OCR结果 褪色单词的一些示例 有什么方法可以恢复褪色的部分 以便提高 OCR 结果吗 我在OpenC
  • 在 google Vision OCR 中被识别为单个单词的特殊字符?

    我试图让谷歌视觉 OCR 正则表达式可搜索 我已经完成了它 并且当文档仅包含英文字符时效果很好 但当有其他语言的文本时 它就会失败 发生这种情况是因为我在谷歌视觉单词组件中只有英文字符 如下所示 VISION API WORD COUNTE
  • InvalidArgumentException:消息:无效参数:“using”必须是字符串

    我对 python 很陌生 试图创建可重用的代码 当我尝试通过传递 Login 类下使用的所有参数来调用 test main py 中的 Login 类和函数 login user 时 我收到错误 InvalidArgumentExcept
  • 自动安排并执行 PHP 脚本

    我编写了一个 PHP 脚本 它生成一个包含数据库中所有表的 SQL 文件 我想要做的是每天或每 n 天执行这个脚本 我读过有关 cron 作业的内容 但我使用的是 Windows 如何在服务器上自动执行脚本 您需要添加计划任务来调用 URL
  • 如何去除给定图像中的噪声,使 ocr 输出完美?

    我已经对这个孟加拉文本图像进行了大津阈值处理 并使用 tesseract 进行 OCR 但输出非常糟糕 我应该应用什么预处理来消除噪音 我也想校正图像 因为它有轻微的倾斜 我的代码如下 import tesserocr from PIL i
  • (Tcl/Expect) 退出后清屏

    我想在退出我的 半 交互式期望脚本后清除屏幕 在本地计算机上 我可以在脚本中做到这一点吗 这是我尝试过的 但失败了 usr bin expect f set env TERM vt100 spawn ssh Y username domai
  • 如何从图像生成 tiff/box 文件以在 Windows 中训练 Tesseract

    我正在尝试在 Windows 中训练 Tesseract 为此我需要一对 tiff box 文件 并且我正在尝试使用 jTessBoxEditor 创建它 但它不接受图像作为输入 我也尝试过 boxFactory 但它无法正常运行 有谁知道
  • 如何在 Ubuntu/Linux 发行版中安装 Tesseract-OCR 3.03?

    我和一个朋友有兴趣为 CV 项目训练 tesseract OCR 引擎 我们尝试使用一些包装器 例如 PyTesser 和 pyocr 但结果目前不如我们需要的那么准确 因此 我们希望尝试训练超立方体以更好地实现我们的目的 即识别食品标签上
  • 是否可以自动化 SQL Server 2008 分析器?

    有一个post https stackoverflow com questions 488020 what is your most useful sql trick to avoid writing more code关于有用的 SQL
  • 无法将 Tesseract OCR 模块添加到 Android Studio

    我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
  • 找不到仅适用于数字的 Tesseract 4.0 tessdata

    正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
  • WatiN 还是 Selenium? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 从笔记本中提取文本

    我正在尝试从图像中提取手写文本 我使用 python 和 opencv 函数 例如 find contours 当我使用像这样的图像时 一切进展顺利 它工作得很好 因为我有一个简单的背景 但后来我用这张图片测试了它 由于背景中有笔记本的线条
  • 去除 OCR 图像处理中的背景颜色

    我正在尝试删除背景颜色 以提高 OCR 对图像的准确性 示例如下所示 我会将所有字母保留在后处理图像中 同时仅删除浅紫色纹理背景 是否可以使用一些开源软件如Imagemagick将其转换为二值图像 黑 白 来实现这一目标 如果背景有不止一种
  • 如何在存储过程中查找数据表列引用

    我更改了 SQL Server 2005 数据库表中的列名称 我还有一个相当大的存储过程集合 它们可能引用也可能不引用该列 有没有办法找到哪些存储过程引用该列 而无需实际遍历每个存储过程并手动搜索它 有没有办法自动查找哪些存储过程现在会中断
  • 最好的 AutoHotKey 宏? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi

随机推荐

  • jqGrid 多选对于大量本地数据非常慢,jQueryUI 1.8、jQueryUI 1.7 都很好

    我在 ASP NET 页面中使用 jqGrid 并将数据注入到页面上的脚本块中 然后从那里加载 对于这一用例 我们需要立即在屏幕上显示大量数据 其中涉及 300 500 条记录 每行 30 列 对于这种情况 分页不太合适 用户需要能够扫描大
  • 修复了带有单个 DOM 元素的响应式顶部导航/关闭画布导航

    让我们先把小提琴排除在外 建立在基础响应式框架 Fiddle 1 一个导航 元素 但当侧面导航滑出时变得不稳定 Fiddle 2 工作但使用多个导航元素 好吧 我一直在绞尽脑汁试图为以下问题开发优雅的解决方案 1 制作一个响应式 固定的导航
  • 停止龙卷风应用程序

    让我们以 Tornado 主页中的 hello world 应用程序为例 import tornado ioloop import tornado web class MainHandler tornado web RequestHandl
  • 用户窗体在“End Sub”后关闭,而无需调用“Unload Me”

    我有一个用户表单 baseUF 它有多个页面和按钮 它们都执行不同的操作 我让这个 baseUF 是无模式的 因为我希望用户能够在不关闭用户窗体并丢失他们输入的所有数据的情况下使用该工作表 然而 我开始遇到一个问题 这可能是由于 baseU
  • 64 位 COM dll 和 C#/.Net 应用程序之间的免注册互操作

    我正在尝试在 64 位 COM dll 和 C 应用程序之间实现免注册 COM 互操作 在我之前的一个问题的回答中 我得到了帮助 使我能够在 C 的 64 位 COM dll 上成功调用 HelloWorld 方法 但是 这只能通过使用 r
  • 将大型复杂数组从 Python 传递到 C++ - 我的最佳选择是什么?

    2017 06 13 编辑 我尝试按照建议使用 boost 但是在花了超过 3 天的时间尝试编译和链接并失败后 我决定愚蠢的痛苦方法可能是最快且不那么痛苦的方法 所以现在我的代码只是保存了一堆巨大的文本文件 跨文件分割数组和数字的复数 虚部
  • EntityFramework:使用视图来扩展表

    我想使用视图将信息添加到这样的表中 public class PocoTable public int Id get set public partial class ImportStatingRecordError Migration p
  • 像整个链接一样在 下划线

    我试图用一行下划线 a 和 span 我希望这一切都是带有下划线的链接 它在单词和跨度之间留下了一个小空格 但它不应该这样 a href Saber mais span class glyphicon glyphicon menu righ
  • PHP 命令行:max_execution_time 和 memory_limit

    快问 如果我从命令行运行 php 脚本 通过 cron 作业 php somwthing sync php 我是否仍然受到 php max execution time 和 memory limit 的限制 Thanks Nathan 如果
  • Spark Kafka 流媒体问题

    我正在使用maven 我添加了以下依赖项
  • 如何将两个 jquery 对象包装成一个?

    我有两个功能 1 function foo elems elems each function foo selector1 selector2 calling foo 2 function bar elem1 elem2 some logi
  • C# WinForms - 如何将更新从 DataGridView 发送到数据库

    我有一个包含客户表和代理表的 mdb 文件 代理表迄今为止所做的唯一一件事就是填充每个客户的代理下拉列表 我有一个链接到 customerBindingSource 的 DataGridView customerBindingSource
  • 使用 firebase 隐藏第 3 方 API 密钥

    我正在使用 firebase 构建一个网站 这是一个简单的查找服务 只有一个输入元素 可以向第 3 方 API 发出请求 www 3rdparty com api myapikey method 问题是我每秒只能发出 x 个请求 并且无法向
  • PHP 5.2 中的 PHP date_parse_from_format() 替代方案

    由于 date parse from format 仅在 PHP 5 3 中可用 因此我需要编写一个函数来模仿其在 PHP 5 2 中的行为 是否可以为 PHP 5 2 编写此函数并使其以与 PHP 5 3 中完全相同的方式工作 Examp
  • 将函数参数重新声明为变量?

    我似乎无法在网络上的任何地方找到这个问题的答案 将函数参数重新声明为局部变量有什么原因 优点或缺点吗 Example function param1 param2 var param1 param2 etc 对我来说似乎非常多余 但也许我错
  • xmlpullparser 的 Android dalvik 转换

    我正在开发一个 Android 应用程序 对于一个组件 我可以在 Android 之外进行测试 因为它不使用任何 Android 代码 它使用 xstream 我有以下库 xstream1 4 6 xpp3 min 1 1 4c xmlpu
  • 在运行时动态加载程序集依赖项时出现问题

    让我尝试解释一下我的问题 我目前正在尝试开发一个用 Net编写的小型 插件框架 主要是为了进行一些实验 因此 我们的想法是拥有一个主应用程序 可以通过在主应用程序的特定文件夹 插件 中部署 dll 来添加 插件 一切工作正常 插件已正确实例
  • 具有相同 id 的多个组件在 android 中如何工作?

    我定义了几种布局 其中很少有 id 被多重定义 我很困惑它是如何工作的 为什么它不像我们在java代码中那样给出错误 最重要的是 环境如何决定需要调用哪个组件 我知道 id 生成的过程是自动化的 它被添加到 R java 中 例如 如果我们
  • 如何使用云函数触发数据流? (Python SDK)

    我有一个由云发布 订阅触发的云函数 我想要使 用 Python SDK 相同的函数触发数据流 这是我的代码 import base64 def hello pubsub event context if data in event mess
  • 基于多个 OCR 软件包输出来改进 OCR 结果的软件

    是否有现有的商业或学术软件可以 来自多个 OCR 软件包 Abbyy FineReader Adobe Acrobat Professional ReadIris 等 的叠加结果 根据从多个来源积累的知识提供完全自动化的改进 允许在运行时使