“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果

2024-01-01

我正在设置language_model_penalty_non_dict_word通过 Tesseract 3.01 的配置文件，但其值没有任何效果。我尝试过使用多个图像及其多个值，但每个图像的输出始终相同。另一位用户也注意到了同样的情况在另一个问题的评论中 https://stackoverflow.com/questions/8940795/strength-of-dictionary-in-tesseract-3#comment19036313_8940795.

Edit:查看源代码后，变量language_model_penalty_non_dict_word仅在函数内部使用float LanguageModel::ComputeAdjustedPathCost.

然而，这个函数永远不会被调用！它仅被 2 个函数引用 -LanguageModel::UpdateBestChoice() and LanguageModel::AddViterbiStateEntry()。我在这些函数中放置了断点，但它们也没有被调用。

经过一番调试，终于找到了原因——函数Wordrec::SegSearch()没有被调用（它在调用图中LanguageModel::ComputeAdjustedPathCost()).

从这段代码来看：

  if (enable_new_segsearch) {
    SegSearch(&chunks_record, word->best_choice,
              best_char_choices, word->raw_choice, state);
  } else {
    best_first_search(&chunks_record, best_char_choices, word,
                      state, fixpt, best_state);
  }

所以你需要设置enable_new_segsearch在配置文件中：

enable_new_segsearch    1

language_model_penalty_non_freq_dict_word 0.2
language_model_penalty_non_dict_word 0.3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果的相关文章

训练 tesseract 与 iPhone 一起使用

我正在尝试在我的 iPhone 应用程序中使用 tesseract 2 04 只想检测数字我在这里所做的首先是使用这篇文章交叉编译 tesseract 以生成 lib 文件http robertcarlsen net 2009 07 15
帮助进行基本编程

我觉得这个问题更多的是我对指针的理解但这里是我想用 C 创建一个系统程序来执行数学运算符 value1 value2 等计算示例数学 1 2 这将在屏幕上产生 3 我在比较或汇总数字时遇到困难这是我到目前为止所拥有的 include
无法将 Tesseract OCR 模块添加到 Android Studio

我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
在 bash 中快速引用 stdout（即上一个命令的输出）？

有没有办法快速例如通过键盘快捷键等引用写入到 stdout 的上一个命令的输出例如如果我这样做 which rails 它回来了 usr local bin rails然后我想在 textmate 中打开该文件我可以像这样重新输入
如何通过批处理脚本检查进程是否正在运行

如何检查应用程序是否正在从批处理以及 cmd 文件运行如果程序已经在运行我不需要启动另一个实例我无法更改应用程序以使其仅作为单个实例该应用程序还可以以任何用户身份运行我想到的另一种可能性不需要保存文件灵感来自于使用grep
在 Perl 中实现 CLI 工具的最佳实践是什么？

我正在使用 Perl 实现 CLI 工具我们可以遵循哪些最佳实践作为前言我花了 3 年时间为一家大型金融公司设计并实现了一个相当复杂的 Perl 命令行工具集以下想法基本上是我们团队设计指南的一部分用户界面命令行选项允许尽可能
从 Windows Batch (cmd.exe) 中的文件读取环境变量

我正在尝试从批处理文件中读取变量以便稍后在批处理脚本 Java 启动器中使用理想情况下我希望所有平台 Unix Windows 上的设置文件都具有相同的格式并且也是有效的 Java 属性文件也就是说它应该看起来像这样 sett
对 ruby 命令行应用程序的代码进行单元测试 - 如何模拟/通过 ARGV

我有一个命令行应用程序它使用 thor 来处理选项的解析我想使用 test unit 和或 minitest 对代码进行命令行功能的单元测试我似乎无法弄清楚如何确保 ARGV 数组通常会保存命令行中的选项保存我的测试选项以便可
tesseract 处理后无法获取原始彩色位图 - android

我使用 android 的 tesseract 库从图像中捕获某些文本我知道捕获的图像不会保存在任何地方它会被回收我需要找到原始的彩色位图我一直在尝试找到原始的彩色位图但我所能找到的只是灰度位图 Bitmap bitmap act
如何让批处理文件等待另一个批处理文件完成执行？

如何让一个批处理文件等待另一个批处理文件完成例如我有 echo hi gt r txt echo some piece of code gt gt r txt start ar bat echo some piece of code g
包含带空格的可执行路径的环境变量是否也应包含必要的引号？

定义环境变量时对我来说在 Windows 上也许有一个更通用的准则 set MY TOOL C DevTools bin mytool exe 如果该工具位于带有空格的路径上 set MY TOOL C Program Files x
p4 命令行相当于“git log -p”？

我经常使用git log p
是否可以在 python shebang 中包含命令行选项？

我的 python 脚本顶部有规范的 shebang usr bin env python 但是当我运行脚本时我仍然经常希望将未缓冲的输出导出到日志文件因此我最终调用 python u myscript py gt myscript
如何使用命令行参数执行jar [重复]

这个问题在这里已经有答案了可能的重复将 Java 解释器所需的参数传递给 JAR https stackoverflow com questions 5536476 passing arguments to jar which is r
共享来自单独命令/进程的属性

我提供带有多个命令和子命令的命令行工具我使用cobra https github com spf13 cobra命令行我有两个单独的命令首先是前提条件e 给其他人例如第一个命令是通过创建临时文件夹并验证某些文件来首选环境第二个命令应
是否可以在终端中使用 adb“强制停止”我正在调试的应用程序？

我正在开发一个应用程序为了调试首次安装时的某些操作我发现使用终端命令 adb uninstall
如何通过 DOS 批处理命令发送电子邮件？

我在 DOS 中有一个批处理文件可以进行一些检查完成后我需要发送一封电子邮件我在 interwebz 上找到了一些解决方案但大多数都是第三方的或者只是在 Outlook 中打开新邮件我需要命令来发送完整的电子邮件而无需任何人工
如何在 Linux 上通过 FTP 递归下载文件夹 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案
如何使用命令行压缩文件？

我想使用批处理文件命令 Windows XP 批处理文件压缩目录例如如果我想解压缩一个文件意味着我可以使用jar xf file zip java bat 文件命令就像我想要一个命令行批处理来压缩目录一样如果您使用的是 Ubunt

随机推荐

Nodejs：使用 async/await 时如何避免嵌套 .then()

以下是我在 Node js 中尝试执行的操作 Rest API 将城市名称作为输入我正在尝试使用输入城市的地理编码 API 获取纬度和经度 then 使用纬度和经度我尝试使用另一个 API 获取最近城市的列表 then 对于所有这些城市
无法找到 XML 模式命名空间的 Spring NamespaceHandler

我正在 eclipse 中的 tomcat 中运行一些 servlet 代码一直工作正常但今天我收到错误Unable to locate Spring NamespaceHandler for XML schema namespace
一笔交易中的多个聚合/存储库

我有一个支付系统如下所示可以通过多张礼券进行支付礼券随购买一起发放客户可以使用此礼券进行日后购买当通过礼券进行付款时 GiftCoupon 表中的UsedForPaymentID 列需要使用该PaymentID 进行更新对于礼券
PHP：当名称没有数组时检索复选框的值

我无法控制的表单是将数据发布到我的 PHP 脚本该表单包含以下复选框
如何在 Java 中编写实现 Comparable 的方法签名“T”？

我的签名上应该有什么insert 方法我正在与仿制药作斗争在某种程度上我两者都想要Comparable
获取添加到indexedDB对象存储中的对象的id

给定一个 indexeddb 数据库其中一个声明的对象存储为 var objectStore thisDb createObjectStore table keyPath id autoIncrement true 当我使用添加请求添加新
为什么 std::getline() 在格式化提取后跳过输入？

我有以下一段代码提示用户输入猫的年龄和名字 include
具有数据虚拟化的 DataGrid 行请求模式

我使用以下一些想法实现了数据虚拟化解决方案CodePlex http datavirtualization codeplex com和博客比亚斯托尔尼茨 http web archive org web 20150722011154 ht
Visual Studio 2019：如何禁用 .editorconfig 中的特定 CodeAnalysis 消息？

是否可以在 VS 2019 中抑制 CodeAnalysis 消息 editorconfig 这两个选项不起作用 cs Trying alternatives to System Diagnostics CodeAnalysis Suppr
Django 管理中是否发生竞争条件（丢失更新或写入倾斜）？

In Django 视图我们可以用select for update https docs djangoproject com en 4 1 ref models querysets select for update阻止竞争条件丢失更
javascript中自执行函数的目的是什么？

在 javascript 中你什么时候想使用这个 function Bunch of code 在此 Bunch of code 这都是关于变量范围的默认情况下自执行函数中声明的变量仅可用于自执行函数中的代码这允许编写代码而无需关心
Java/libGDX - 如何检查多边形与矩形或圆形的碰撞

我是 libGDX 的新手据我所知 Intersector 类具有矩形矩形圆圆圆矩形和多边形多边形的重叠方法但由于某种原因它似乎没有任何方法检查多边形矩形或多边形圆形是否有推荐的方法来检查多边形和矩形圆形之间的碰撞
Page Curl 的现状

关于 iPad 上的卷页动画存在很多问题最近越来越多的应用程序已经包含了这一点我在 github 上看到了两个实现此动画的项目的链接 here https github com jemmons PageCurl and here htt
描边矩形 svg 的左侧和右侧

我使用 d3 在 svg 中绘制了一个矩形并且只想描边左侧和右侧
hbm2ddl 忽略@Column 注释？

为什么 hbm2ddl 会忽略 Column 注释这是我的课 import javax persistence Column import javax persistence Entity import javax persistence
返回 HttpResponseMessage 时的 WebAPI Gzip

我有一个 WebAPI 控制器它返回一个HttpResponseMessage我想添加 gzip 压缩这是服务器代码 using System Net Http using System Web Http using System We
在 iOS 应用程序中安装特定字体时遇到问题 - 不兼容的 TTF？

我的代码仓库中有一些 Nubian 和 Nubian Alt 字体的字体文件它们已获得许可并付费并且需要使用但是我无法在 iOS 中使用此字体并且无法使用 Font Book 打开该字体即使该字体在 Finder 中预览正常并且
Spring boot 示例：无法启动嵌入式容器错误

我是 spring 新手所以我从 spring intializr 下载了 jar for maven web java 1 8 demo 我将其提取并导入到 STS 中以运行 main 文件但出现以下异常有人可以告诉我这个问题的解决
ASP.MVC：实现非模板化视图引擎？

我对 ASP MVC 还很陌生对于我们的新 Web 应用程序我正在考虑两种视图引擎选项使用一些可用的视图引擎默认的 NVelocity Brail 等作为主要视图代码生成器实现特定于应用程序的 C DSL 来生成 HTML 代码
“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果

我正在设置language model penalty non dict word通过 Tesseract 3 01 的配置文件但其值没有任何效果我尝试过使用多个图像及其多个值但每个图像的输出始终相同另一位用户也注意到了同样的情况在

“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果

“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果 的相关文章

随机推荐

热门标签

“language_model_penalty_non_dict_word”在 tesseract 3.01 中没有效果的相关文章