使用 OCR 识别上标字符

2024-03-05

我已经开始了一个简单的项目，其中它必须获取包含带有上标的文本的图像，然后通过使用 OCR（目前我使用的是 tesseract）它必须识别上标字符 + 普通字符。

例如，我们有一个化学方程式，例如 Cl²，但是当我使用超立方体识别它时，它给出了 Cl2（全部在一行中）。

那么，这个问题的解决办法是什么呢？是否有其他 OCR API 能够读取上标？

非常好的问题，涉及任何 OCR 系统的更高级功能。

首先，确保您没有忽略该功能，即使它可能存在于 OCR 系统上。确保不是以纯 TXT 格式查看结果测试，而是以某种支持富文本功能的查看器查看。 TXT 查看器（例如 Windows 上的记事本）通常不支持上标/下标字符，因此即使 OCR 为您提供正确的字符，您的查看器也可能会对其进行转换以显示它。如果您以编程方式访问文本结果，那么这就不是什么问题，因为您在直接访问时应该获得正确的下标字符值。请注意，观众必须支持它，您才能真正看到它。如果您消除了这种可能的后处理转换并确保 OCR 没有返回下标，那么它可能不支持它。

就像在这个文本框中一样，在您原来的问题中，您试图给我们一个上标字符示例，但该文本框不接受它，即使您可以从其他地方复制/粘贴它。

许多 OCR 会将下标视为任何其他普通字符（如果他们能看到的话）。您使用的 OCR 需要具备实际生成上标/下标的技术能力，而且很多都这样做，但它们往往是商业 OCR 系统，这并不奇怪。

在回复这封信之前我做了一个小测试用例。我生成了一个带有一些上标/下标示例的图像用于测试（当然 EMC2 是我想到的第一个示例:)。
您可以在这里找到我的测试图像：www.ocr-it.com/documents/superscript_subscript_test_page.tif http://www.ocr-it.com/documents/superscript_subscript_test_page.tif

并通过处理该图像OCR-IT OCR云2.0 API http://www.ocr-it.com使用所有默认设置，但导出为富文本格式，例如 MS Word .DOC。

您可以在这里找到我的测试图像：www.ocr-it.com/documents/superscript_subscript_test_page_result.doc http://www.ocr-it.com/documents/superscript_subscript_test_page_result.doc

另请注意：当您有兴趣提取上标/下标字符时，请特别注意图像质量，而不是典型文本。这些字符很小，您需要足够的细节和分辨率才能达到下降的 OCR 质量。即使以 300 dpi 扫描图像，有时也会因像素太少而出现小字符问题。如果您正在考虑移动和数码相机，这一点就变得更加重要。

披露：我的专长是为不同规模的公司实施内部 OCR 解决方案。我的公司是明智趋势 http://www.wisetrend.com。如果我需要进一步的帮助，请直接联系我。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 OCR 识别上标字符的相关文章

提高识别率的图像预处理步骤

我正在为我的项目使用 TessBaseAPI 制作一个简单的 OCR Android 应用程序我已经完成了一些图像预处理步骤例如二值化和图像增强但他们的结果是50 到60 怎样才能提高识别率呢我包括两个示例图像 http image
超正方错误 - 图像太大

对于大小为 5 MB 的图像我从 tesseract 收到以下错误 Tesseract 开源 OCR 引擎 v3 01 与 Leptonica 第0页图片太大 39667 56133 处理过程中出错文件大小是否有限制或者是否有参数可
tess4j 与 Spring mvc

我已经尝试将 tess4j 作为独立的 java 程序并且它可以正常工作并给出文本输出现在我正在尝试创建一个 spring mvc web 项目在 pom 中添加 tess4j 的依赖项并且我已在我的项目中添加了 tess4j 源
pytesseract找不到指定的文件

我的代码很简单如下所示 import pytesseract from PIL import Image img Image open C temp foo jpg img load i pytesseract image to stri
图像中的文本检测

I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
Python Tesseract 无法识别这种字体

我有这个图像我想使用 python 将其读取为字符串我认为这并不难我发现了 tesseract 然后是使用 tesseract 的 python 脚本的包装器所以我开始阅读图像效果很好直到我尝试阅读这张图像我是否需要训练它来读
无法在 Mac 上安装 Tesseract-OCR

我正在尝试使用 pytesseract 在 python 2 7 14 中制作 OCR 程序当我运行我的代码时 from PIL import Image import pytesseract print pytesseract imag
裁剪图像后，如何找到新的边界框坐标？

这是我得到的收据图像我使用 matplotlib 绘制了它 x1 y1 x2 y2 x3 y3 x4 y4 bbox coords 650 850 1040 850 1040 930 650 930 image cv2 imread IM
在python中使用tesseract 3.02的C API与ctypes和cv2

我正在尝试在 python 中将 Tesseract 3 02 与 ctypes 和 cv2 一起使用 Tesseract 提供了一组公开的 DLL C 风格 API 其中之一如下 TESS API void TESS CALL TessB
在进行字符识别之前使用 OpenCV 进行图像预处理（超正方体）

我正在尝试开发简单的 PC 应用程序用于车牌识别 Java OpenCV Tess4j 图像不是很好进一步它们会很好我想对超立方体图像进行预处理但我被困在车牌检测矩形检测上我的步骤 1 源图像 Mat img new Mat i
Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC
用Python识别图像

我对 OCR 识别和 Python 都有点陌生我想要实现的是从 Python 脚本运行 Tesseract 以识别 tif 中的某些特定数字我以为我可以为 Tesseract 做一些培训但我在 Google 和 SO 上没有找到任何
Tesseract 是否会忽略扫描文档中的任何非文本区域？

我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本但它最终会给出误报匹配理想情况下您应该在将图像
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
训练 tesseract 与 iPhone 一起使用

我正在尝试在我的 iPhone 应用程序中使用 tesseract 2 04 只想检测数字我在这里所做的首先是使用这篇文章交叉编译 tesseract 以生成 lib 文件http robertcarlsen net 2009 07 15
如何从图像生成 tiff/box 文件以在 Windows 中训练 Tesseract

我正在尝试在 Windows 中训练 Tesseract 为此我需要一对 tiff box 文件并且我正在尝试使用 jTessBoxEditor 创建它但它不接受图像作为输入我也尝试过 boxFactory 但它无法正常运行有谁知道
从笔记本中提取文本

我正在尝试从图像中提取手写文本我使用 python 和 opencv 函数例如 find contours 当我使用像这样的图像时一切进展顺利它工作得很好因为我有一个简单的背景但后来我用这张图片测试了它由于背景中有笔记本的线条
从超立方体图像中获取文本的确切位置

使用 tesseract 中的 GetHOCRText 0 方法我能够检索 html 中的文本并在 webview 中呈现 html 时我能够获取文本但图像中文本的位置与输出不同任何想法都非常有帮助 tesseract gt Se
Tesseract OCR 培训的替代方案？

在过去的三个月里我一直在尝试训练 Tesseract通过识别我拥有的图像集合由于真正的缺乏适当的文档以及非常高的复杂性我开始放弃 Tesseract 作为解决方案我正在寻找一种相对无痛的替代方案对于训练我不想在这里重新发现轮子如

随机推荐

有没有办法跟踪 API 网关限制的调用？

我一直在使用 CloudWatch 跟踪 API Gateway 和 Lambda 的指标它显示 Lambda 的受限制的调用但是有什么方法可以查看 API Gateway 之前限制的调用数量还没有但我们计划在不久的将来解决这个问题
自动委托java类的所有方法

假设我有一个包含许多公共方法的类 public class MyClass public void method1 public void method2 public void methodN 现在我想创建一个wrapper类它将所有方
使用 javascript 旋转 div

我想单击一个 div 并旋转另一个 div 然后当再次单击第一个 div 时另一个 div 旋转回其原始位置如果需要我可以参考这个库http ricostacruz com jquery transit http ricostacruz
创建新的 SQLCommand 或重复使用相同的 SQLCommand

我需要使用 ADO NET 将一系列命令发送到 SQL 2008 以便逐个执行我应该为我发送的每个 SQL 创建一个新的 SQLCommand 吗或者重用相同的 SQLCommand 并仅更改 CommandText 属性谢谢内斯特
动态构建表达式树

我正在遵循这个很好的例子将 Linq to Sql 表达式转换为表达式树 https stackoverflow com questions 5225416 convert linq to sql expression to expres
暂时禁用 SelectItems

我有一个
如何查找该月的最后一天？

我正在尝试新的 Google Dart 语言但我不知道如何获取当月的最后一天这给了我当前日期 var now new DateTime now 为下个月提供零的日期值可得出上个月的最后一天 var date new DateTime 2
如何在不使用 Windows 任务计划程序的情况下安排运行 bat 文件？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我有一个触发 Python 脚本的批处理 bat 文件该脚本需要大约 25 分钟才能交互完成通过命令提示符手动完成该批处理文件需要每天
为什么捆绑程序不会在 OS X 10.8 上安装 json 1.7.4 gem？

我使用的是 OS X 10 8 XCode 4 4 Ruby 1 9 3 和 Rails 3 2 当我从 git 克隆我的 Rails 项目并运行时 bundle install I get 安装 json 1 7 4 Errno EPER
如何在play框架2.1中使用wro4j

有一种方法可以包含 wro4jhttp code google com p wro4j http code google com p wro4j 在java play框架2 1中我需要编译 hogan js 模板并执行更多操作无需重新发
Storm 如何知道消息何时“完全处理”？

还有一些关于超时和 maxSpoutPending 的问题我在 Storm 文档中看到很多关于消息被完全处理的参考资料但是我的 KafkaSpout 如何知道消息何时被完全处理希望它能够识别我的 Bolt 的连接方式以便当我的 St
热衷于仅在 datagridview 中更改特定的列标题颜色？

使用 VS 2005 C DataGridView WinForms 我需要为特定列的标题部分的字体背景着色我发现它只能对整个列列表的标题而不是单个列进行非常感谢任何帮助首先在 DataGridView 中您需要将 Enable
Coq 中的 Modus Ponens 和 Modus Tollens

我想要针对这些简单的推理规则使用 Ltac 策略在 Modus Ponens 中如果我有H P gt Qand H1 P Ltac mp H H1将添加Q到上下文为H2 Q 在 Modus Tollens 中如果我有H P gt Qa
让 FTP 在 Azure VM 上运行，克服 ftp 客户端上的“连接关闭”问题

我正在努力连接到 Azure 中新 VM 上的 FTP 我从默认映像 Windows Server 2012 Datacenter 创建了一个新的虚拟机并通过 RDP 连接到新的虚拟机中然后我启用了 Web 服务器 IIS 角色包括
将Excel上传控件添加到网格工具栏

有没有一种方法可以让网格控件允许从 Excel 工作表上传数据我还没有找到可以将此控件放在工具栏上的命令您需要装饰数据视图PXImportAttribute Example PXViewName Messages SOLine PXIm
使用selenium：如何在Python中关闭Driver后保持登录状态

我想在第二次在 chrome 驱动程序上打开 Whatsapp 网站时登录我的 Whatsapp 网站 web whatsapp com 以下是我基于Python的代码需要您的帮助 from selenium import webdriv
SVN 上的 HG Convert 给出“看起来不像 Subversion 存储库”

我刚刚安装了 TortoiseHG v2 11 和 Mercurial 2 9 我正在尝试转换使用 TortoiseSVN 1 8 创建的本地 Subversion 存储库 4 颠覆1 8 5 为了确保我的旧 Subversion 存储库没
从本地主机连接到 Xero OAuth2 出现 CORS 错误

我正在连接到 Xero oauth 服务器 https login xero com identity connect authorize https login xero com identity connect authorize 通过
在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）

我正在构建一个 Python 实用程序它将涉及将整数映射到单词字符串其中许多整数可能映射到同一个字符串根据我的理解 Python 默认情况下会实习短字符串和大多数硬编码字符串从而通过在表中保留字符串的规范版本来节省内存开销我认
使用 OCR 识别上标字符

我已经开始了一个简单的项目其中它必须获取包含带有上标的文本的图像然后通过使用 OCR 目前我使用的是 tesseract 它必须识别上标字符普通字符例如我们有一个化学方程式例如 Cl 但是当我使用超立方体识别它时它给出了 Cl

使用 OCR 识别上标字符

使用 OCR 识别上标字符 的相关文章

随机推荐

热门标签

使用 OCR 识别上标字符的相关文章