如何在 OCR 中区分斜线零和八 (0->8)

2024-02-07

我正在为我的 Android 应用程序使用 ML Kit for Firebase (ReCalc：收据计算器 https://play.google.com/store/apps/details?id=info.trekto.receipts）并且它的表现非常好，除了以下情况削减零。在大约一半或更多的情况下，它会将斜线零识别为八。

我的一个想法是对区域中包含零的矩形进行切片，并检测中间上方和下方的区域是否是黑色的。但实际上...

我打算训练模型对零和八进行分类.

这是一项繁重的工作，因此我决定首先在这里询问另一个解决方案/想法。

这是一个例子：

类似问题：Tesseract OCR 将削减的 0 混淆为 8 https://stackoverflow.com/questions/53090447/tesseract-ocr-confuses-slashed-0-as-8

最后我自己训练了一个模型。

其准确率相当不错（超过98%）。然而我担心它的概括性如何。

这是该项目：ZEC - 削减零八分类器 https://github.com/trayanmomkov/zec

我还创建了一个应用程序，展示如何在 Android 上使用该模型：ZECA - 适用于 Android 的削减零八分类器 https://github.com/trayanmomkov/zeca

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

OCR

firebasemlkit

如何在 OCR 中区分斜线零和八 (0->8) 的相关文章

在防风草模型上使用 VIP 包计算重要性度量

我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性对于正则表达式我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4
敏感性特异性图 python

我正在尝试重现类似于此的灵敏度特异性图其中 X 轴是阈值但我还没有找到如何做到这一点一些 skalern 指标如 ROC 曲线会返回真阳性和假阳性但我还没有找到任何选项来制作此图我试图将概率与实际标签进行比较以保持计数我得到
Azure 机器学习 - CORS

我已经搜索了几个小时但找不到任何可以回答这个问题的东西我创建并发布了新的 Azure 机器学习服务并创建了一个终结点我可以使用 Postman REST 客户端调用该服务但通过 JavaScript 网页访问它会返回一个控制台日志
使用 sklearn 进行稀疏主成分分析

我正在尝试从中复制一个应用程序paper https people eecs berkeley edu elghaoui Pubs SPCAhandbookSV pdf 作者下载的地方20个新闻组 http scikit learn org
为什么我的精确率-召回率和 ROC 曲线不平滑？

我有一些标记为 0 或 1 的数据我正在尝试使用随机森林来预测这些类别每个实例都标有 20 个用于训练随机森林的特征约 30 000 个训练实例和约 6000 个测试实例我使用以下代码绘制精确召回率和 ROC 曲线 precisio
神经网络误差随每个训练示例而振荡

我已经实现了一个反向传播神经网络并根据我的数据对其进行了训练数据在英语和非洲语句子之间交替神经网络应该识别输入的语言网络结构为27 16 2 输入层对于字母表中的每个字母都有 26 个输入加上一个偏置单元我的问题是当遇到每个新的训
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
从 Azure ML 工作室下载经过训练的 ML 模型以部署在独立计算机上

我已在 Azure ML 中设置了 ML 模型studio我可以使用 ML Studio 的 Web API 来获取预测将模型托管在 Azure ML Studio 中的关键挑战是客户端计算机的互联网依赖性以及与每个预测相关的延迟我想了
我的训练和验证代码（张量流）是否正确以及模型是否过度拟合？

这是我的代码 for it in range EPOCH 24410 BATCH SIZE tr pa tr sp sess run tr para tr spec train loss sess run loss fw op feed d
Keras Predict_classes 方法返回“列表索引超出范围”错误

我对 CNN 和机器学习总体来说是新手并且一直在尝试遵循 TensorFlow 的图像分类教程现在可以找到Google Colabhere https colab research google com drive 1gwZp7 t
地图应用的聚类算法

我正在研究地图上的聚类点纬度经度对于快速且可扩展的合适算法有什么建议吗更具体地说我有一系列纬度经度坐标和一个地图视口我正在尝试将靠近的点聚集在一起以消除混乱我已经有了解决问题的方法 see here http bouldr
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
在具有不平衡数据的管道中进行交叉验证的正确方法

对于给定的不平衡数据我创建了一种不同的标准化管道和一种热编码 numeric transformer Pipeline steps scaler StandardScaler categorical transformer Pipelin
机器学习鸡尾酒会音频应用

我对这篇文章有一个疑问鸡尾酒会算法 SVD 实现用一行代码 https stackoverflow com questions 20414667 cocktail party algorithm svd implementation i
有没有keras方法来分割数据？

我认为标题是不言自明的但要详细询问有 sklearn 的方法train test split 其工作原理如下 X train X test Y train Y test train test split X Y test size 0
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test

随机推荐

Java中确定十进制值最快最有效的方法是整数

给定一个名为的双变量sizeValue and sizeValue包含除 0 以外的内容确定该内容的最有效方法是什么sizeValue包含一个整数值目前我正在使用大小值 1 0 还有其他更快的方法吗尝试一下数学细胞 http jav
尝试使用通用链接设置到应用程序的重定向，但没有任何反应

所以我的网站上有以下 apple app site association 位于stage domain com apple app site association applinks apps details appID TEAMID a
如何在字节数组中搜索“StringA”？

使用 FreePascal 如果没有 FP 示例则使用 Delphi 给定一个作为字节数组的 2048 字节缓冲区我如何在缓冲区中搜索 StringA var Buffer array 1 2048 of byte repeat i
如何在mongodb存储库中使用@query添加orderby

我想用 spring 将 orderby 添加到 mongodb 中的以下存储库方法中我尝试了各种方法但没有成功 public interface StageRepository extends MongoRepository
嵌套两次的 sizeof 可以成为依赖表达式吗？

我注意到 gcc 5 0 拒绝以下代码而 clang 3 6 接受它 template
使用基于MySQL数据库的Flask更新网页。

我有一个网页使用 HTML 和 jQuery 构建它显示来自 MySQL 数据库的数据我正在使用 Flask 将 HTML 与我的数据库连接起来但是我的数据库每 15 分钟更新一次使用单独的 Python 脚本目前我停止 F
解密 Python 中使用 PHP 中的 MCRYPT_RIJNDAEL_256 加密的字符串

我在 PHP 中有一个函数可以加密文本如下所示 function encrypt text Key MyKey return trim base64 encode mcrypt encrypt MCRYPT RIJNDAEL 256 Ke
IAsyncEnumerable 与 IEnumerable> 之间有什么区别？

新的 C 8 0 和 dotnet core 3 具有 AsyncStreams 这个新功能 IAsyncEnumerable
iOS中如何将字符串转换为日期格式？

我有来自网络服务的字符串例如12 31 2013 09 12 15 A M 现在我想将其转换为12 Dec 2013 09 12 15 A M 与使用NSDAteFormatter in iOS 我正在给你答案但因为你的问题太初级而否决
如何删除Material ui中文本字段字段集中的边框

我需要删除边框我使用了一些来自堆栈溢出的CSS 但问题还没有解决如果有人请帮我解决这个问题我将非常感谢我写了什么CSS来删除边框
关闭 USB 端口的电源

我正在寻找扭转的方法power关闭然后重新打开 USB 端口解决方案可以是 C bash 等我使用运行 32 位 Ubuntu 16 04 的 BeagleBone for armhf gt uname srvm Linux 4 4
Javascript 获取元素内的文本

我需要获取元素内的文本我只能获取该元素的类而不能获取 ID span class fileName test png span 所以我需要一种方法来获得test png 但正如你所见我只有元素的类没有 ID 请注意我们可能还有更多
jquery ui sortable('refresh') 不起作用！

我正在使用一个可排序列表可以通过 jquery 由另一个脚本添加和删除元素并且遇到一个奇怪的问题这些新生成的项目似乎是可拖动的但它们实际上不会排序除非我在页面加载时已经有了它们我尝试过使用 sortable refresh 但似
防止新的原型方法出现在对象中键的 for 循环中

我有一个函数我想让它可供所有对象使用它的 mergeObject object 函数定义如下 Object prototype mergeObjects function object if typeof object object r
日期序列化后 Laravel 7 中的时区错误

我正在开发一个新的 Laravel 7 1 应用程序不是升级但似乎使用日期序列化会失去时区配置应用程序 php timezone gt Europe Zurich 修补匠的例子 gt gt gt Carbon Carbon pars
使用Python实现并集查找

所以这就是我想要做的我有一个包含几个等价关系的列表 l 1 2 2 3 4 5 6 7 1 7 我想合并共享一个元素的集合这是一个示例实现 def union lis lis set e for e in lis res while T
Jackson JSON反序列化：每行中的数组元素

我在用Jackson https github com FasterXML jackson core并且想要漂亮地打印 JSON 以便数组中的每个元素都进入每一行例如 foo bar blah 1 2 3 Setting Serializ
Kubernetes：如何正确设置 php-fpm 和 nginx 共享卷权限

我是 kubernetes 的新手目前我正在尝试在 kubernetes 上部署 laravel 应用程序我设置了 1 个部署 yaml 其中包含 2 个容器 nginx 和 php fpm 和一个共享卷这是完整的 yaml apiV
使用 C# .net 挂载其他用户 hive

我正在编写一个应用程序它将为每个选定的用户写入一些注册表项我想知道是否有正确的方法来安装另一个用户的配置单元以在其中写入目前我正在使用 REG LOAD 来安装每个配置单元它很实用但很混乱任何想法预先感谢您的回答 Cheer
如何在 OCR 中区分斜线零和八 (0->8)

我正在为我的 Android 应用程序使用 ML Kit for Firebase ReCalc 收据计算器 https play google com store apps details id info trekto receipts

如何在 OCR 中区分斜线零和八 (0->8)

如何在 OCR 中区分斜线零和八 (0->8) 的相关文章

随机推荐

热门标签