为 Tesseract OCR 创建训练图像

2023-11-21

我正在编写一个用于 Tesseract OCR 训练图像的生成器。

为 Tesseract OCR 的新字体生成训练图像时，最佳值是：

The DPI
字体大小（以磅为单位）
字体是否应该抗锯齿
Should the bounding boxes fit snugly: , or not:

第二个问题在这里得到了某种答案：http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Generate_Training_Images 无需使用多种尺寸进行训练。 10分就可以了。（一个例外是非常小的文本。如果您想识别 x 高度小于约 15 像素的文本，您应该专门训练它或在尝试识别它们之前缩放图像。）

问题 1 和 3：根据经验，我已成功使用 300 dpi 图像/非抗锯齿字体。更具体地说，我在训练 pdf 上使用了以下转换参数，生成了令人满意的图像：

convert -density 300 -depth 8 [input].pdf -background white -flatten +matte -compress none -monochrome [output].tif

但后来我尝试向 Tesseract 添加点线字体，它仅在我使用 150 dpi 图像时才能正确检测到字符。所以，我认为没有通用的解决方案，这取决于您要添加的字体类型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OCR

Tesseract

为 Tesseract OCR 创建训练图像的相关文章

unicharset_extractor：找不到命令

我想使用超正方体创建新的列车数据因此请按照以下网站中提到的步骤进行操作 https blog cedric ws how to train tesseract 301 https blog cedric ws how to train
如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想检测图像中的表格识别表格块以及其中可能的文本在 tesseract 的早期版本中可以使用参数 textord dump t
tess4j 与 Spring mvc

我已经尝试将 tess4j 作为独立的 java 程序并且它可以正常工作并给出文本输出现在我正在尝试创建一个 spring mvc web 项目在 pom 中添加 tess4j 的依赖项并且我已在我的项目中添加了 tess4j 源
pytesseract找不到指定的文件

我的代码很简单如下所示 import pytesseract from PIL import Image img Image open C temp foo jpg img load i pytesseract image to stri
图像中的文本检测

I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
用于屏幕文本的 OCR（光学字符识别）

我正在尝试创建一个软件通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别来查找要单击的特定按钮例如我已经有了鼠标和键盘控制部分但现在我需要 OCR 来处理屏幕截图我发现 Tesseract OCR 似乎不能很好地处
C# - 无法找到 x64 平台的库“leptonica-1.80.0.dll”

我正在使用 Tesseract 5 2 0 创建一个控制台应用程序下面是我的代码 System Drawing Bitmap img new System Drawing Bitmap convertedFile TesseractEng
使用 Tesseract OCR 和 python 进行数字识别

我使用 Tesseract 和 python 读取数字从能量计除了数字 1 之外一切都运行良好 Tesseract 无法读取 1 数字 This is the picture I send to tesseract tesseract
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
在tesseract中添加任何traineddata文件并在IOS中使用

我能够编译英语版本该版本已经在 tesseract 的示例中但无法添加其他语言例如 ara traineddata 我正在做这样的事 Tesseract tesseract Tesseract alloc initWithDataPa
用Python识别图像

我对 OCR 识别和 Python 都有点陌生我想要实现的是从 Python 脚本运行 Tesseract 以识别 tif 中的某些特定数字我以为我可以为 Tesseract 做一些培训但我在 Google 和 SO 上没有找到任何
Tesseract 是否会忽略扫描文档中的任何非文本区域？

我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本但它最终会给出误报匹配理想情况下您应该在将图像
在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

我尝试编写一个基于深度网络的程序来读取手写数字我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
如何在 Ubuntu/Linux 发行版中安装 Tesseract-OCR 3.03？

我和一个朋友有兴趣为 CV 项目训练 tesseract OCR 引擎我们尝试使用一些包装器例如 PyTesser 和 pyocr 但结果目前不如我们需要的那么准确因此我们希望尝试训练超立方体以更好地实现我们的目的即识别食品标签上
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
使用 Tesseract 进行手写识别

我只是想知道如果将大写字母全部放在表格中自己的小框中那么超正方体的手写识别准确度有多高我知道你可以训练它来识别你自己的笔迹但我的问题是我需要在多个笔迹中使用它有人能指出我正确的方向吗多谢简而言之您必须训练 Tesseract
如何从复杂的验证码中提取数字

我正在尝试解析下图的验证码 https ibb co 35X723J https ibb co 35X723J 我尝试过使用超正方体 data br open captchaurl read b bytearray data save op
Tesseract 似乎不适用于数字

我按照常见问题解答让 Tesseract 识别数字但我得到的只是输出文件中的一堆文本尽管我的图像中只有数字我的命令行如下所示 tesseract tessdata dir input jpg output output digits
Tesseract OCR 培训的替代方案？

在过去的三个月里我一直在尝试训练 Tesseract通过识别我拥有的图像集合由于真正的缺乏适当的文档以及非常高的复杂性我开始放弃 Tesseract 作为解决方案我正在寻找一种相对无痛的替代方案对于训练我不想在这里重新发现轮子如
如何从图像中识别车辆牌照/车牌（ANPR）？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个网站允许用户上传汽车图像我想放置一个隐私过滤器来检测车辆上的车牌并对其进行模糊处理模糊不是问题但是是否有库或组件首选

随机推荐

与R语言匹配以获得位置

我使用 match 来获取元素是否在列表中例如我的清单是 c a b h e and so on 如果我想查看元素 h 是否在列表中我可以这样使用 match if h in v do something 如何获取列表中找到元素的位置
Firestore 安全规则：仅当新文档 ID 与用户 ID 相同时才允许用户创建文档

当用户第一次登录时我还需要调用一个函数在我的 firestore 用户集合中创建一个文档来存储他们的个人资料数据使用Web SDK 我之前使用带有 firebase 函数的新用户触发事件但等待冷函数启动的速度太慢安全规则要求需要
Haskell：模块导入带来不必要的二进制增长

当我通过以下方式之一将大模块导入主模块时 import Mymodule import qualified Mymodule as M import Mymodule MyDatatype 与我不导入该模块时相比编译后的二进制文件增长
如何限制android中edittext的输入时间

我必须允许用户在动态编辑文本中仅输入格式的时间有什么方法可以实现吗我使用了下面的代码但它不起作用我可以输入超过 24 个值的数字例如 45623 5689 edit setInputType InputType TYPE DAT
如何使用 Edge 浏览器在 VSCode 中调试 Angular 应用程序？

我在用边缘延伸下面是配置launch json configurations name ng serve type edge request launch url http localhost 4200 webRoot workspace
自定义图例/图像作为传单地图中的图例

我用自定义图标作为标记构建了一个地图您可以在我的 jsfiddle 中查看代码和结果 https jsfiddle net marielouisejournocode x24stb0m 我尝试更改正常图例代码以将图片放在那里但我对
由于（据称）未跟踪的文件而导致文件覆盖的 Git 警告

尝试从 git repo 中拉取但得到以下输出我认为这些文件被跟踪它们应该被跟踪但它表明它们没有被跟踪它们不在 gitignore 中我在分支后面进行了大约 5 10 次提交 git pull rebase origin mas
观察 Vuejs 中 window.scrollY 的变化

我有一个非常简单的应用程序有 2 个组件 App vue和另一个组件 Home vue我在其中保存应用程序的其余结构粘性标题和一些带有可滚动到的锚点的部分我想对粘性标题应用一个类以在页面滚动时最小化徽标所以我想我会留意任何变化wi
按值传递（StringBuilder 与 String）[重复]

这个问题在这里已经有答案了我不懂为什么System out println 名称输出Sam不受方法的 concat 函数的影响而System out println 名称输出Sam4作为该方法的追加方法的结果为什么 StringB
使用新模型和防护的 Laravel 身份验证失败：未定义索引：模型

我正在尝试使用额外的模型和防护来验证我的 Laravel 应用程序 5 8 问题是我在以下登录方法中收到未定义索引模型错误有什么想法我做错了吗我已经在 Laravel 5 7 版本中使用了这个集成并且它在那里工作没有任何问题
使用 Firebase FCM 时为什么无法折叠推送通知？

const options priority high collapseKey user id const deviceTokensPromise db ref users fcm tokens user id once value dev
如何为 32 位位图生成单色位掩码

在 Win32 下通过执行以下操作从位图生成单色位掩码以供透明度使用是一种常见技术 SetBkColor hdcSource clrTransparency VERIFY BitBlt hdcMask 0 0 bm bmWidth bm
Laravel 图片库逻辑

我最近开始开发一个相当大的网站在该网站上我希望允许用户上传他们的示例作品目前我们的能力非常有限因此图像将存储在我们的服务器上我有点被逻辑困住了所以我的逻辑是这样的用户创建一个文件夹其名称存储在数据库中users id附于其上
PackageMaker 用于在 Windows/Linux 上创建 Mac 包

我们需要即时构建 Mac 包如果有一种方法可以在 Windows 或 Linux 平台上创建相同的包而不是在 Mac 上使用 PackageMaker 那将会很方便有任何想法吗我不同意这是不可能的您当然可以在另一个操作系统上执行
找不到 com.squareup.picasso:picasso:2.5.2

我添加了毕加索依赖项但似乎不起作用我尝试更改版本但还是没用这是我的 build gradle 模块 apply plugin com android application android compileSdkVersion 23
如何在 Angular 材质的 Snackbar 上添加 html 内容？

我已经创建了烤面包机 snackbar 来响应消息我想在烤面包机 snackbar 上添加 html 内容以便可以以正确的格式显示多条消息我努力了 var test h1 The Header h1 p The paragraph o
如何配置jetty监听多个端口

我只是想配置jetty来监听多个端口我不需要多个实例也不需要多个 Web 应用程序只需要一个码头一个 Web 应用程序但监听 2 个或更多端口默认方式不支持多条目
Rails 从控制台调用控制器操作

我有一个可以创建会话的控制器会话我想从控制台调用它例如controller create 这是动作 def create raise request env omniauth auth to yaml auth request env
使用托管标识在 Azure 中对应用程序服务进行身份验证

我在 Azure 中设置了两个应用程序服务 Parent 和 Child 都公开 API 端点子级有端点 Get 父级具有端点 Get 和 GetChild 使用 HttpClient 在子级上调用 Get 我希望所有子端点都需要通过托管
为 Tesseract OCR 创建训练图像

我正在编写一个用于 Tesseract OCR 训练图像的生成器为 Tesseract OCR 的新字体生成训练图像时最佳值是 The DPI 字体大小以磅为单位字体是否应该抗锯齿 Should the bounding boxes

为 Tesseract OCR 创建训练图像

为 Tesseract OCR 创建训练图像 的相关文章

随机推荐

热门标签

为 Tesseract OCR 创建训练图像的相关文章