4 Tesseract-ocr 系列 : 开源OCR比较

2023-11-19

对开源OCR做一个简单的调研,网上找到的关于OCR的一些资料:

国内参考资料:

最好的开源或开放API的ocr引擎是什么?
https://www.zhihu.com/question/22417946

列举了4中OCR
目录:
1. Tesseract-OCR (Google)
2. Azure (Microsoft)
3. ABBYY Real-Time Recognition SDK
4. ocr space

OCR:几大开源库
http://blog.csdn.net/qianliheshan/article/details/48974927

OCR 中文识别用哪种软件识别率比较高?
https://www.zhihu.com/question/19593313

OCR识别的开源分析
http://blog.csdn.net/luojun2007/article/details/51614133

国外资料:
What are the best open source OCR libraries?
https://www.quora.com/What-are-the-best-open-source-OCR-libraries

Are you looking for programming libraries or even OCR software works for you ?
OCR libraries
1) Python pyocr and tesseract ocr over python
2) Using R language ( Extracting Text from PDFs; Doing OCR; all within R )
Free OCR Softwares
1. Google’s & HP’s Tesseract
2. Google’s Keep
3. Microsoft Document Imaging ( MODI ) ( assuming majority of us would be having a windows OS )
4. Microsoft One Note
5. Microsoft Oxford Project API ( This API is free until some time )
6. FreeOCR ( This is based on Tesseract engine again )
There are lot more but these are the best and out of all these, if you are looking for accuracy , Microsoft Document Imaging does better job. And if you are looking for hand written text ocr conversion then Google’s Keep does better job.
Commercial Products
1. Adobe Acrobat Pro ( RTF file format gives you best result )
2. Captiva
3. Abbyy
4. Informatica ( Not sure which module within Informatica )
5. IBM Datacapture (Datacap) (IBM Watson)
If accuracy is only your main constraint, there is something like Unprecedented Data Access at your Service( captricity ) which boasts of 99% accuracy since they crowd source people and make them convert hand written text without compromising security.

关于Tesseract-OCR (Google)
支持100多种语言,自带的库识别率不高,但是关键是可以自己训练来改善识别率。提供支持 C 和 C++ 的API。目前使用的最多。
关于安装、使用、训练等详细说明可以参见GitHub:https://github.com/tesseract-ocr/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

4 Tesseract-ocr 系列 : 开源OCR比较 的相关文章

  • windows 杀死占用端口的程序

    在Windows上 你可以使用以下命令来查找并杀死占用某个端口 如9200 的程序 打开命令提示符 Command Prompt 或者PowerShell 运行以下命令来查找占用9200端口的程序的进程ID PID netstat ano
  • 除了 Tesseract 之外还存在哪些 OCR 选项? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 新画图不好用?『 图层困扰?』『 剪切板拷贝失败?』旧版画图软件yyds

    樊梓慕 个人主页 个人专栏 C语言
  • 训练 tesseract 后,tessdata 文件夹中应包含哪些文件?

    我使用 tesseract 作为我的 ANPR 应用程序的 OCR 引擎 我已经用车牌字体训练了 tesseract 3 01v 但我需要知道 tessdata 文件夹中应包含哪些文件 我应该使用安装 tesseract 3 01v 的同一
  • Java OCR 库有推荐吗? [复制]

    这个问题在这里已经有答案了 我需要检查大量图片 看看它们是否有关键字 谁能推荐一个好的 可靠的 OCR 库 我很乐意牺牲速度来换取准确性 没有纯 Java OCR 库具有与准确性有关的事情 https stackoverflow com q
  • 为什么用 PIL 和 pytesseract 无法获取字符串?

    这是一个简单的Python 3光学字符识别 OCR 程序来获取字符串 我已经在这里上传了目标gif文件 请下载并另存为 tmp target gif try from PIL import Image except ImportError
  • 神经网络特征提取

    我正在使用神经网络进行字母和数字的简单识别 到目前为止 我使用字母图像的每个像素作为网络的输入 不用说 这种方法产生的网络非常大 所以我想从图像中提取特征并将它们用作神经网络的输入 我的第一个问题是字母的哪些属性有利于识别它们 第二个问题是
  • 超正方体的替代方案

    Python 或 OpenCV 中是否有替代软件或任何库可以替代 Tesseract 进行字符识别 有什么建议的可以用Python实现的字符识别方法吗 Thanks This site https github com kba awesom
  • 了解 OCR 的 Freeman 链码

    请注意 我确实在寻找问题的答案 我是not寻找一些源代码或一些学术论文的链接 我已经使用了源代码 并且我已经阅读了论文 但仍然没有弄清楚这个问题的最后部分 我正在研究一些快速屏幕字体 OCRing 并且取得了很好的进展 我已经找到基线 分离
  • 使用 Google App Script 从 google 驱动器中进行 OCR 图像

    我已经实现了以下脚本 使用图像 URL 对单个和多个图像进行 OCR function doOCRALL var selected SpreadsheetApp getActiveSheet getActiveRange getValues
  • tesseract 无法识别该图像中的这个单词,这正常吗?

    我需要从这样的小图像中提取单词 我在命令行中使用带有西班牙语选项的 tesseract 如下所示 tesseract category png l spa psm 7 category txt 我认为该文本一定很容易被 OCR 解析 但该单
  • 什么是可以检测手写的好的 OCR? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我需要一个库 可以在扫描手写纸后从其中提取文本 正常拉丁文本 它可以是一个免费的解决方案 甚至是我必须付费的解决方案 只要它可以处理大写字
  • Tess-2 OCR 不工作

    我试图在 Android 上使用 tess two 从图像中获取文本 但这给了我一个非常糟糕的结果 01 16 12 00 25 339 I Tesseract native 29038 Initialized Tesseract API
  • 使用 OpenCV 对 Tesseract OCR 进行图像预处理

    我正在尝试开发一个应用程序 它使用 Tesseract 来识别手机摄像头拍摄的文档中的文本 我使用 OpenCV 来预处理图像以实现更好的识别 应用高斯模糊和阈值方法进行二值化 但结果非常糟糕 Here https s6 postimg c
  • 超正方错误 - 图像太大

    对于大小为 5 MB 的图像 我从 tesseract 收到以下错误 Tesseract 开源 OCR 引擎 v3 01 与 Leptonica 第0页 图片太大 39667 56133 处理过程中出错 文件大小是否有限制 或者是否有参数可
  • 使用背景校正图像 (Python)

    我正在开发一个项目 对标签上的文本进行 OCR 操作 我的工作是对图像进行倾斜校正 使其可以用超正方体读取 I have been using this approach https www pyimagesearch com 2017 0
  • tesseract (v3.03) 输出为 PDF [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 为什么会返回这个错误呢 root amd 3700 2gb ocr test tesseract l dan pdf png out pd
  • TensorFlow:训练时参数不更新

    我正在使用 TensorFlow 实现分类模型 我面临的问题是 当我运行训练步骤时 我的权重和误差没有更新 结果 我的网络不断返回相同的结果 我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
  • 如何将 Tesseract 导入 Angular2 (TypeScript)

    我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中 但是在使用时 import Tesseract from types tesseract js it s
  • 以编程方式识别 PDF 文件中的扫描文本 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个 PDF 文件 其中包含我们需要导入数据库的数据 这些文件似乎是打印的字母数字文本的 pdf

随机推荐

  • 字符串转整形数据

    c 语言字符转化为数字的函数有 atof 将字符串转换为双精度浮点型值 atoi 将字符串转换为整型值 atol 将字符串转换为长整型值 strtod 将字符串转换为双精度浮点型值 并报告不能被转换的所有剩余数字 strtol 将字符串转换
  • 竞赛选题 卷积神经网络手写字符识别 - 深度学习

    文章目录 0 前言 1 简介 2 LeNet 5 模型的介绍 2 1 结构解析 2 2 C1层 2 3 S2层 S2层和C3层连接 2 4 F6与C5层 3 写数字识别算法模型的构建 3 1 输入层设计 3 2 激活函数的选取 3 3 卷积
  • 微信小程序api语法及代码实例(入门到精通)

    前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到网站 小程序Api App 全局入口 整个小程序项目中 只允许有一个App入口函数 全局数据 globalData 写在全局的js里 使用this
  • 设计模式之(三)---工厂方法模式

    女娲补天的故事大家都听过吧 这个故事是说 女娲在补了天后 下到凡间一看 哇塞 风景太优美了 天空是湛 蓝的 水是清澈的 空气是清新的 太美丽了 然后就待时间长了就有点寂寞了 没有动物 这些看的到 都是静态的东西呀 怎么办 别忘了是神仙呀 没
  • CTFSHOW web11-14

    目录 web11 web12 web13 web14 web11 其他不重要 直接看代码
  • c语言——矩阵运算器

    话不多说 上代码 include
  • 信号完整性之串扰

    1 前言 当PCB板上走线间距较近 一条走线上传输信号时 会在邻近的走线上引起噪声 这种现象称为串扰 串扰实际上是相邻走线之间的一种能量传递现象 下图显示了这种串扰现象 上方的走线传输信号 无论下方的走线是否有信号在传输 其两端都会产生噪声
  • MySQL避免索引失效

    create table staffs id int primary key auto increment name varchar 24 not null default comment 姓名 age int not null defau
  • 偶然发现的一篇相见很晚的文章:如何学好游戏编程

    今天偶然发现一篇介绍如何学好游戏编程的文章 相见恨晚呀 特转载 转帖地址 http new qzone qq com 79134054 blog 1226580538 如何学好游戏编程 此篇文章献给那些为了游戏编程不怕困难的热血青年 它的神
  • mac,macbook 连接蓝牙耳机播放音乐断断续续

    个人的情况是 mac本连的网线 用的无线鼠标 屋里80多号人都在用笔记本 应该也有好多开着无线的东西 解决方法 mac 或macbook 连接蓝牙耳机播放音乐断断续续的原因 在网上找了好多方法 试了各种方法 用各种命令 都完全没有效果 终于
  • VMware Workstation 17 pro 开机一段时间后,cpu飙高、卡死、、、

    报错截图 临时解决方案 找到VMware workstation 17 pro 安装包 右键 以管理员身份运行 修复 重启即可 永久解决 控制面板 程序 启用或关闭Windows功能 去掉 Windows 虚拟机监控程序平台 虚拟机平台 的
  • 《金融数据分析导论:基于R语言》习题答案(第一章)

    金融数据分析导论 基于R语言 是芝加哥大学的教授Ruey S Tsay所著 李洪成 尚秀芬 郝瑞丽翻译 机械工业出版社出版 是一本学习R语言和金融数据分析的很好的参考书籍 注 这些答案都是本人自己做出的结果 可能有错 仅供参考 发现有错的地
  • openstack用户管理笔记

    1 创建项目 1 1 创建项目 需要确认集群环境是否初始化完毕 实验初始化需要几分钟时间 访问控制节点IP dashboard 如果正常弹出登录页面即初始化完毕 假设控制节点IP为172 20 6 22 则访问地址为 172 20 6 22
  • ElasticStack运维必备技能-集群版

    一 背景介绍 首先 我们为什么要用这个产品呢 生产业务中必然会遇到大量业务日志需要分析 在日志量非常大的场景中 直接使用工具 如cat grep awk 就可以获得想要的信息 效率非常低 在这种情况下 如何快速搜索想要信息 如查询 排序 归
  • 车载操作系统汇总

    文章目录 车载操作系统 一 软件定义汽车 为什么是软件定义汽车 车载OS 承上启下 引领智能汽车发展 车载OS在车载智能计算平台中的位置 车载OS市场空间 车载操作系统 二 车控操作系统 什么是车控操作系统 车控操作系统的特点 车控操作系统
  • python3.6.5安装tensorflow_tensorflow(一)windows 10 python3.6安装tensorflow1.4与基本概念解读...

    一 安装 目前用了tensorflow deeplearning4j两个深度学习框架 tensorflow 之前一直支持到python 3 5 目前以更新到 故安装最新版体验使用 慢慢长征路 安装过程如下 anaconda3 5 PYTHO
  • vue跳转this.$router.push()同一路由如何强制刷新页面

    1 新建一个名为refresh vue的文件 放在你认为合理的任意目录 2 在refresh vue里添加 beforeRouteEnter 路由钩子 代码块 代码如下
  • Unity经典项目及作品

    1 Unity Chan Toon Shader https github com unity3d jp UnityChanToonShaderVer2 Project 2 Procedural Cave Generator https g
  • Tensorflow--------tf.nn库

    1 tf nn 提供神经网络相关操作 包括卷积神经 conv 池化操作 pooling 归一化 loss 分类操作 embedding RNN Evaluation 2 tf layers 高层的神经网络 和卷积神经有关 3 tf cont
  • 4 Tesseract-ocr 系列 : 开源OCR比较

    对开源OCR做一个简单的调研 网上找到的关于OCR的一些资料 国内参考资料 最好的开源或开放API的ocr引擎是什么 https www zhihu com question 22417946 列举了4中OCR 目录 1 Tesseract