为 Tesseract OCR 创建训练图像

2023-11-21

我正在编写一个用于 Tesseract OCR 训练图像的生成器。

为 Tesseract OCR 的新字体生成训练图像时,最佳值是:

  1. The DPI
  2. 字体大小(以磅为单位)
  3. 字体是否应该抗锯齿
  4. Should the bounding boxes fit snugly: enter image description here, or not: enter image description here

第二个问题在这里得到了某种答案:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Generate_Training_Images 无需使用多种尺寸进行训练。 10分就可以了。 (一个例外是非常小的文本。如果您想识别 x 高度小于约 15 像素的文本,您应该专门训练它或在尝试识别它们之前缩放图像。)

问题 1 和 3:根据经验,我已成功使用 300 dpi 图像/非抗锯齿字体。更具体地说,我在训练 pdf 上使用了以下转换参数,生成了令人满意的图像:

convert -density 300 -depth 8 [input].pdf -background white -flatten +matte -compress none -monochrome [output].tif

但后来我尝试向 Tesseract 添加点线字体,它仅在我使用 150 dpi 图像时才能正确检测到字符。所以,我认为没有通用的解决方案,这取决于您要添加的字体类型。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为 Tesseract OCR 创建训练图像 的相关文章

  • unicharset_extractor:找不到命令

    我想使用超正方体创建新的列车数据 因此 请按照以下网站中提到的步骤进行操作 https blog cedric ws how to train tesseract 301 https blog cedric ws how to train
  • 如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我想检测图像中的表格 识别表格块以及其中可能的文本 在 tesseract 的早 期版本中 可以使用参数 textord dump t
  • tess4j 与 Spring mvc

    我已经尝试将 tess4j 作为独立的 java 程序 并且它可以正常工作并给出文本输出 现在我正在尝试创建一个 spring mvc web 项目 在 pom 中添加 tess4j 的依赖项 并且我已在我的项目中添加了 tess4j 源
  • pytesseract找不到指定的文件

    我的代码很简单 如下所示 import pytesseract from PIL import Image img Image open C temp foo jpg img load i pytesseract image to stri
  • 图像中的文本检测

    I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
  • 用于屏幕文本的 OCR(光学字符识别)

    我正在尝试创建一个软件 通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别 来查找要单击的特定按钮 例如 我已经有了鼠标和键盘控制部分 但现在 我需要 OCR 来处理屏幕截图 我发现 Tesseract OCR 似乎不能很好地处
  • C# - 无法找到 x64 平台的库“leptonica-1.80.0.dll”

    我正在使用 Tesseract 5 2 0 创建一个控制台应用程序 下面是我的代码 System Drawing Bitmap img new System Drawing Bitmap convertedFile TesseractEng
  • 使用 Tesseract OCR 和 python 进行数字识别

    我使用 Tesseract 和 python 读取数字 从能量计 除了数字 1 之外 一切都运行良好 Tesseract 无法读取 1 数字 This is the picture I send to tesseract tesseract
  • 如何提取图像中的表格

    我想从图像中提取表格 这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
  • 在tesseract中添加任何traineddata文件并在IOS中使用

    我能够编译英语版本 该版本已经在 tesseract 的示例中 但无法添加其他语言 例如 ara traineddata 我正在做这样的事 Tesseract tesseract Tesseract alloc initWithDataPa
  • 用Python识别图像

    我对 OCR 识别和 Python 都有点陌生 我想要实现的是从 Python 脚本运行 Tesseract 以 识别 tif 中的某些特定数字 我以为我可以为 Tesseract 做一些培训 但我在 Google 和 SO 上没有找到任何
  • Tesseract 是否会忽略扫描文档中的任何非文本区域?

    我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本 我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本 但它最终会给出误报匹配 理想情况下 您应该在将图像
  • 在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

    我尝试编写一个基于深度网络的程序来读取手写数字 我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
  • 如何在 Ubuntu/Linux 发行版中安装 Tesseract-OCR 3.03?

    我和一个朋友有兴趣为 CV 项目训练 tesseract OCR 引擎 我们尝试使用一些包装器 例如 PyTesser 和 pyocr 但结果目前不如我们需要的那么准确 因此 我们希望尝试训练超立方体以更好地实现我们的目的 即识别食品标签上
  • 找不到仅适用于数字的 Tesseract 4.0 tessdata

    正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
  • 使用 Tesseract 进行手写识别

    我只是想知道 如果将大写字母全部放在表格中自己的小框中 那么超正方体的手写识别准确度有多高 我知道你可以训练它来识别你自己的笔迹 但我的问题是我需要在多个笔迹中使用它 有人能指出我正确的方向吗 多谢 简而言之 您必须训练 Tesseract
  • 如何从复杂的验证码中提取数字

    我正在尝试解析下图的验证码 https ibb co 35X723J https ibb co 35X723J 我尝试过使用超正方体 data br open captchaurl read b bytearray data save op
  • Tesseract 似乎不适用于数字

    我按照常见问题解答让 Tesseract 识别数字 但我得到的只是输出文件中的一堆文本 尽管我的图像中只有数字 我的命令行如下所示 tesseract tessdata dir input jpg output output digits
  • Tesseract OCR 培训的替代方案?

    在过去的三个月里我一直在尝试训练 Tesseract通过识别我拥有的图像集合 由于真正的缺乏适当的文档 以及非常高的复杂性 我开始放弃 Tesseract 作为解决方案 我正在寻找一种相对无痛的替代方案对于训练 我不想在这里重新发现轮子 如
  • 如何从图像中识别车辆牌照/车牌(ANPR)? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个网站 允许用户上传汽车图像 我想放置一个隐私过滤器来检测车辆上的车牌并对其进行模糊处理 模糊不是问题 但是是否有库或组件 首选

随机推荐

  • 与R语言匹配以获得位置

    我使用 match 来获取元素是否在列表中 例如我的清单是 c a b h e and so on 如果我想查看元素 h 是否在列表中 我可以这样使用 match if h in v do something 如何获取列表中找到元素的位置
  • Firestore 安全规则:仅当新文档 ID 与用户 ID 相同时才允许用户创建文档

    当用户第一次登录时 我还需要调用一个函数 在我的 firestore 用户集合中创建一个文档来存储他们的个人资料数据 使用Web SDK 我之前使用带有 firebase 函数的新用户触发事件 但等待冷函数启动的速度太慢 安全规则要求 需要
  • Haskell:模块导入带来不必要的二进制增长

    当我通过以下方式之一将 大 模块导入主模块时 import Mymodule import qualified Mymodule as M import Mymodule MyDatatype 与我不导入该模块时相比 编译后的二进制文件增长
  • 如何限制android中edittext的输入时间

    我必须允许用户在动态编辑文本中仅输入 格式的时间 有什么方法可以实现吗 我使用了下面的代码 但它不起作用 我可以输入超过 24 个值的数字 例如 45623 5689 edit setInputType InputType TYPE DAT
  • 如何使用 Edge 浏览器在 VSCode 中调试 Angular 应用程序?

    我在用边缘延伸 下面是配置launch json configurations name ng serve type edge request launch url http localhost 4200 webRoot workspace
  • 自定义图例/图像作为传单地图中的图例

    我用自定义图标作为标记构建了一个地图 您可以在我的 jsfiddle 中查看代码和结果 https jsfiddle net marielouisejournocode x24stb0m 我尝试更改 正常 图例代码以将图片放在那里 但我对
  • 由于(据称)未跟踪的文件而导致文件覆盖的 Git 警告

    尝试从 git repo 中拉取 但得到以下输出 我认为这些文件被跟踪 它们应该被跟踪 但它表明它们没有被跟踪 它们不在 gitignore 中 我在分支后面进行了大约 5 10 次提交 git pull rebase origin mas
  • 观察 Vuejs 中 window.scrollY 的变化

    我有一个非常简单的应用程序 有 2 个组件 App vue和另一个组件 Home vue我在其中保存应用程序的其余结构 粘性标题和一些带有可滚动到的锚点的部分 我想对粘性标题应用一个类 以在页面滚动时最小化徽标 所以我想我会留意任何变化wi
  • 按值传递(StringBuilder 与 String)[重复]

    这个问题在这里已经有答案了 我不懂为什么System out println 名称 输出Sam不受方法的 concat 函数的影响 而System out println 名称 输出Sam4作为该方法的追加方法的结果 为什么 StringB
  • 使用新模型和防护的 Laravel 身份验证失败:未定义索引:模型

    我正在尝试使用额外的模型和防护来验证我的 Laravel 应用程序 5 8 问题是 我在以下登录方法中收到 未定义索引 模型 错误 有什么想法我做错了吗 我已经在 Laravel 5 7 版本中使用了这个集成 并且它在那里工作没有任何问题
  • 使用 Firebase FCM 时为什么无法折叠推送通知?

    const options priority high collapseKey user id const deviceTokensPromise db ref users fcm tokens user id once value dev
  • 如何为 32 位位图生成单色位掩码

    在 Win32 下 通过执行以下操作从位图生成单色位掩码以供透明度使用是一种常见技术 SetBkColor hdcSource clrTransparency VERIFY BitBlt hdcMask 0 0 bm bmWidth bm
  • Laravel 图片库逻辑

    我最近开始开发一个相当大的网站 在该网站上 我希望允许用户上传他们的示例作品 目前我们的能力非常有限 因此图像将存储在我们的服务器上 我有点被逻辑困住了 所以我的逻辑是这样的 用户创建一个文件夹 其名称存储在数据库中users id附于其上
  • PackageMaker 用于在 Windows/Linux 上创建 Mac 包

    我们需要即时构建 Mac 包 如果有一种方法可以在 Windows 或 Linux 平台上创建相同的包 而不是在 Mac 上使用 PackageMaker 那将会很方便 有任何想法吗 我不同意这是不可能的 您当然可以在另一个操作系统上执行
  • 找不到 com.squareup.picasso:picasso:2.5.2

    我添加了毕加索依赖项 但似乎不起作用 我尝试更改版本 但还是没用 这是我的 build gradle 模块 apply plugin com android application android compileSdkVersion 23
  • 如何在 Angular 材质的 Snackbar 上添加 html 内容?

    我已经创建了烤面包机 snackbar 来响应消息 我想在烤面包机 snackbar 上添加 html 内容 以便可以以正确的格式显示多条消息 我努力了 var test h1 The Header h1 p The paragraph o
  • 如何配置jetty监听多个端口

    我只是想配置jetty来监听多个端口 我不需要多个实例 也不需要多个 Web 应用程序 只需要一个码头 一个 Web 应用程序 但监听 2 个或更多端口 默认方式不支持多条目
  • Rails 从控制台调用控制器操作

    我有一个可以创建会话的控制器会话 我想从控制台调用它 例如controller create 这是动作 def create raise request env omniauth auth to yaml auth request env
  • 使用托管标识在 Azure 中对应用程序服务进行身份验证

    我在 Azure 中设置了两个应用程序服务 Parent 和 Child 都公开 API 端点 子级有端点 Get 父级具有端点 Get 和 GetChild 使用 HttpClient 在子级上调用 Get 我希望所有子端点都需要通过托管
  • 为 Tesseract OCR 创建训练图像

    我正在编写一个用于 Tesseract OCR 训练图像的生成器 为 Tesseract OCR 的新字体生成训练图像时 最佳值是 The DPI 字体大小 以磅为单位 字体是否应该抗锯齿 Should the bounding boxes