收据褪色部分可以恢复吗？

2024-05-05

我有一些包含一些扫描收据的文件，我需要使用 OCR 从中提取文本。由于收据上打印的文字在一段时间后会褪色，导致收据上的某些文字不清晰，影响OCR结果。

褪色单词的一些示例：

有什么方法可以恢复褪色的部分，以便提高 OCR 结果吗？

我在OpenCV中尝试过图像阈值处理和图像平滑，但结果不是很令人满意。图像可以进一步处理吗？

Averaging then Gaussian Threshold

Gaussian Blur then Gaussian Threshold

这种方法并不完美，并不适合所有字符（最好指定字符范围，将它们分开，然后在单独的字符上尝试此方法）。这是一个基本的想法；也许你可以完成它。最终的字符看起来不像原始字体，可能只是更易读。考虑到所选择的方法，这似乎很自然；由于字符的损坏，识别初始字体的名称和类型并不容易。

import sys
import cv2
import numpy as np

# Load and resize image
im = cv2.imread(sys.path[0]+'/im.png')
H, W = im.shape[:2]
S = 4
im = cv2.resize(im, (W*S, H*S))

# Convert to binary
msk = im.copy()
msk = cv2.cvtColor(msk, cv2.COLOR_BGR2GRAY)
msk = cv2.threshold(msk, 200, 255, cv2.THRESH_BINARY)[1]

# Glue char blobs together
kernel1 = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (11, 13))
kernel2 = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (4, 5))
msk = cv2.medianBlur(msk, 3)
msk = cv2.erode(msk, kernel1)
msk = cv2.erode(msk, kernel2)

# Skeletonization-like operation in OpenCV
thinned = cv2.ximgproc.thinning(~msk)

# Make final chars
msk = cv2.cvtColor(msk, cv2.COLOR_GRAY2BGR)
thinned = cv2.cvtColor(thinned, cv2.COLOR_GRAY2BGR)
thicked = cv2.erode(~thinned, np.ones((9, 15)))
thicked = cv2.medianBlur(thicked, 11)

# Save the output
top = np.hstack((im, ~msk))
btm = np.hstack((thinned, thicked))
cv2.imwrite(sys.path[0]+'/im_out.png', np.vstack((top, btm)))

有关模块及其许可证的更多信息：OpenCV https://github.com/opencv, NumPy https://numpy.org/about/

请注意，thinning算法位于opencv_contrib存储库；因此，请考虑其使用许可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

opencv

imageprocessing

OCR

Receipt

收据褪色部分可以恢复吗？的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject

随机推荐

在 Scala 中将 Map[String, String] 转换为 Map[String, Int]

我有一个 Map 其中键是 String 值是 Int 但表示为 String scala gt val m Map a gt 1 b gt 2 c gt 3 m scala collection immutable Map String
使用相位相关和对数极坐标变换获得旋转位移

我一直在编写一个脚本它使用 cv2 计算两个图像之间的旋转位移phaseCorrelate method 我有两张图像第二张是第一张图像的 90 度旋转版本加载图像后我将它们转换为对数极坐标然后将它们传递到phaseCorrela
当 docker 处于分离状态或前台时，日志不会发送到 AWS Cloudwatch

当我以交互模式运行 docker 脚本时它可以工作我可以在控制台和 AWS CloudWatch Logs 中查看日志下面的 docker 脚本以交互模式运行我添加了 awslogs 配置以便日志进入 cloudwatch doc
无论如何，您是否可以检查 Azure CLI 在后台执行哪些 API 调用？

我正在使用适用于 Azure 的 Python SDK 但我可以看到文档缺乏正确的信息和示例我知道 Azure CLI 是在 Azure 的 Python SDK 之上构建的因此我想知道是否有任何方法可以知道在执行以下操作时正在调用什么
Hibernate 和 Spring - 具有从同一父级继承的多个成员的实体会导致 JDBCException、@Transactional 怪异

这是重写我的另一个问题 https stackoverflow com questions 7800054 spring mvc app hibernate genericjdbcexception 我有一个 Spring WebMVC 应
SwiftUI • 如何实现半屏ShareSheet？

我在我的项目中实现了一个 ShareSheetSwiftUI App using UIViewControllerRepresentable Code struct ShareView UIViewControllerRepresentab
如何在android中对Log.e进行单元测试？

我需要执行单元测试在应用程序中发生特定情况时我需要检查是否记录错误消息 try do something catch ClassCastException IndexOutOfBoundsException e Log e INFOTA
iPhone - UITextView 应该看起来像 UITextField

我需要一个文本字段以便用户可以编写多行不幸的是 UITextField 不提供多行所以我想我必须使用 UITextView 但两者的设计并不相同是否可以像 UITextfield 标准一样设计具有白色背景和圆角的 UITextVie
ADO.NET 实体框架的实际好处是什么？

我正在读这篇关于ADO NET 实体框架 http msdn microsoft com en us library bb399572 aspx并发现它非常有趣尽管在第一个镜头中我无法破译很多东西我再次阅读这篇文章以了解其背后的真正逻
为什么 __instancecheck__ 并不总是根据参数调用？

有这样的代码 class Meta type def instancecheck self instance print instancecheck return True class A metaclass Meta pass a A i
Python串口通信

我正在开发一个 Arduino 项目由于内存限制我将其与 Python 脚本连接起来在Python方面我有一个二维矩阵其中包含各自的x y坐标值并且在此列表中有26000个坐标对因此为了向大家澄清数据结构 pathlist
空指针异常 - findViewById()

谁能帮我找出这个程序可能存在的问题在里面onCreate 方法findViewById 为所有 id 返回 null 这会导致稍后出现空指针异常我不明白为什么findViewById 找不到视图有什么建议么这是主要代码 public
反向 P/Invoke 教程？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个旧的 C C 类我想使用 PInvoke 重构并从 net 访问它所有 P Invoke
如何生成带logo的二维码？

我正在为 Android 设备开发应用程序我想生成带有徽标的二维码 With ZXing I know how to generate simple QR codes like this one But I want to generat
Facebook URL 调试：抱歉，出了点问题。我们正在尽快努力修复这个

https developers facebook com tools debug https developers facebook com tools debug 有谁知道为什么某些 URL 会出现此错误而其他 URL 则不会错误
使用 python (openpyxl) 从 Excel 中删除网格线

我正在尝试从使用 openpyxl 创建的 Excel 工作表中删除网格线但它不起作用我正在这样做 wb Workbook ws wb get active sheet ws show gridlines False print ws
setState 没有在 Dart / Flutter 中重新加载状态？

我遵循了 Google CodeLabs 的 Flutter 教程 Part 1 https codelabs developers google com codelabs first flutter app pt1 Part 2 http
当`enableProdMode()`时到底发生了什么[重复]

这个问题在这里已经有答案了我正在与Angular2 quick start演示使用TypeScript 一切正常但在演示完成后我在浏览器控制台中看到一条消息 Angular 2 正在开发模式下运行调用enableProdMode 启
模板类中的模板函数 is_same

为什么这段代码会产生错误的输出 this type cpp include
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC

收据褪色部分可以恢复吗？

收据褪色部分可以恢复吗？ 的相关文章

随机推荐

热门标签

收据褪色部分可以恢复吗？的相关文章